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CATTCCGATT 


ATCATTTCAT 


ATAAAGAAGG 


TTTACATATT 


ATTAAAGATT 


TAATTGTTGC 


15900 


GACATTACGA 


GCAGTTGTGC 


AATTAATCAT 


TTTGGGATTT 


TTGCTG CATT 


ATATTTTTAA 


15960 


AATAAACGAT 


AAATGGCTGC 


TTAT TTTATG 


TGTATTGGTC 


ATTATTATTA 


ATGCATCATG 


16020 


GAATACAATT 


AGTCGAGCAT 


CAC CAGTGAT 


GCATCATGTG 


TTTTGGATAT 


CATTTCTAGC 


16060 


TATCTTCATT 


GGAACGGCAT 


TACCGCTTGC 


AGGTACTATT 


GCGACAGGGG 


CCATTCAATT 


16140 


TACCGCAAAT 


GAAGTTATAC 


CTATCGGCGG 


CATGCTTGCA 


AATAATGGCT 


TGATTGCAAT 


16200 


TAATTTAGCT 


TACCAGAATT 


TAGATCGTGC 


ATTCGTACAA 


GATGGTACTA 


ATATTGAATC 


16260 


TAAATTATCA 


CTTGCAGCTA 


CACCTAAATT 


GGCTTCTAAA 


GGTGCAATAC 


GTGAAAGTAT 


16320 


TCGTTTAGCT 


ATAGTGCCAA 


CTATTGATTC 


GGTTAAAACA 


TATGGGCTTG 


TGTCGATTCC 


16380 


TGGTATGATG 


ACAGGCTTAA 


TTATTGGTGG 


CGTACCACCT 


TTACAAGCGA 


TTAAATTTCA 


16440 


ATTGTTAGTC 


GTGTTTATTC 


ATACAACTGC 


GACCATTATG 


TCTGCTTTGA 


TTGCGACATA 


16500 


TTTAAGCTAT 


GGTCAATTTT 


TGAATGCAAG 


ACATCAATTA 


GTAGCACGAA 


ATACTGATGT 


16560 


TAAGAGTGAA 


TCATGATAGA 


TTTTACTGCA 


TCAGATTTAG 


G CATT AGTTT 


TAATTGGAAA 


16620 


TGAAGTGACG 


CGCACATATA 


GTATCGCTAT 


TCATTAGCGC 


AGCGAAAATA 


TTCATAAAGG 


16680 


CACG CATACT 


TTGTAGTCAG 


TTATCTGTTC 


TGACATATAA 


AGCGTGCGTG 


CTTTTTTGGA 


16740 


GTTATTGTTG 


AAACTGAAGT 


AATTATACAT 


AATTATTAAA 


TGACATACTT 


GTGTTAATTT 


16800 


TTCAAATACT 


GAAAAACAAT 


TTCaATAATT 


TTCCaATTAA 


GCACAGAAAA 


TTAAAGCAAA 


16860 


ATATTATATA 


ATAGAACGGT 


TATATATcLAA 


nATTngTgCA 


CACATTTTTT 


AATAAATCGT 


16920 


TATTCTAAGG 


GAAATGAATA 


TCGGAAATTT 


TGTTTGAAAG 


GAGTTTTAAA 


TTGTCAATCA 


16980 


TGCGACTATT 


TACATTCATT 


TTAAGTATTT 


TTATCGTAGG 


AATGGTTGAA 


ATGATGGTTG 


17040 


CAGGAATTAT GAACTTGATG 


AGTCAGGACT 


TACATGTATC 


AGAAGCTGTC 


GTTGGTCAAT 


17100 


TAGTGACAAT GTACGCTTTA 


ACATTTGCGA 


TATGTGGACC 


TATTCTGGTT 


AAATTAACGA 


17160 


AccGrrrrrc 


ATCAAGGCCT 


GTATTATTAT 


GGACATTACT 


TATATTTATC 


ATTGGTAATG 


17220 


GCATTATTGC 


TGTAGCGCCA 


AATTTTTCaA 


TATTAGTAGT 


TGGTAGAATT 


ATCTCATCTG 


17280 


CAGCAGCAGC ACTAATTATC 


GTAAAAGTAT 


TAGCTATTAC 


AGCGATGTTA 


TCAGCACCTA 


17340 


AAAATCGTGG 


TAAAATGATT 


GGACTTGTCT 


ATACAGGGTT 


TAGTGGTGCT 


AATGTTTTTG 


17400 


GTGTACCAAT 


TGGAACGGTT 


ATCGGCGATT 


TAGTAGGTTG 


GCGCTATACA 


TTTCTATTCT 


17460 


TAATTATTGT 


GAGTATTATT 


GTTGGCTTCT 


TGATGATGAT 


CTATTTACCG 


AAGGATCAGG 


17520 


AAATACAACG 


AGGCCCTGTG 


AATCATGAGA 


CACCATCTCA 


TGAAAATCAT 


GTTACTTCGA 


17580 
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CAAACTCAGT GACATTCGTC TTTATAAATC CACTTATTTT ATCTAATGGT CATGATATGT 17700 

CATTCGTTTC ATTAGCACTT CTAGTAAATG GAATCGCTGG CGTTATTGGA ACATCATTAG 17760 

5 

GTGGTATATT CTCCGATAAA ATTACAAGTA AGCGTTGGTT AATGATTTCT GTTTCTATTT 17820 

TTATCGTCAT GATGTTACTT ATGAATTTAA TCTTACCTGG TTCAGGTCTA TTGTTAGCAG 17880 

GACTATTTAT TTGGAATATC ATGCAATGGA GTACTAATCC AGCAGTGCAA AGCGGTGTGA 17940 

10 

TTCAACATGT TGAAGGCGAC ACAAGCCAAG TAATGAGTTG GAACATGTCT AGTTTAAACG 18000 

CTGGTATTGG TGTTGGAGGC ATTATTGGAG GCTTGGTCAT GACACATGTT TCTGTTCAAG 18060 

1S CTATCACATA TACGAGTGCC ATCATTGGCG CATTAGGATT AATCGTTGTT TTCACATTGA 18120 

AAAATAATCA TTATGCTAAA ACATTTAAAT CATCATAATT CTCATATGAm AAGCACGCCT 18180 

GCTATCAAAT TCAGGTGTGC TTTTTTAGAT GCGATAACGT TATTGATATG TGCGATAATA 18240 

20 GCGACGTTCA TTATGATACA TCGGCCAAGG CATTTTACCG CTTTTAGCAA AATTAGCTAA 18300 

ATCATTTTGC ATTTGTCGAC TTAAAAATTT AAGGTGaGCA GTTGTTGGaT ATgAT 1B355 
(2) INFORMATION FOR SEQ ID NO: 68: 

25 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1192 base pairs 

(B) TYPE: nucleic acid 
<C) STRAND EDNESS : double 
(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 68: 
CGCAAAGAAG TACAAAAAAT GTTTTTACAA GAAGGTATTA AAACACCTCA ACCAATTATG 60 

35 

ACTGCTTATA ATCATAGTGA AAACGgTGTT TAGTAGTTTA TAATACATGG AGGTCATATT 120 
TAATGGCGTC AAAATATGGA ATAAATGATA TAGTAGAAAT GAAAAAACAA CATGCGTGTG 180 
GAACAAACCG TTTTAAGATT ATTAGAATGG GTGCAGACAT AAGAATTAAA TGTGAAAATT 24 0 

40 

GTCAAAGAAG TATTATGATT CCACGTCAAA CGTTTGATAA AAAACTTAAA AAAATCATCG 300 
AATCTCATGA TGATACACAA AGATAGGAGA ATGATTAATG GCTTTAACAG CAGGTATCGT 360 

45 TGGATTGCCA AACGTTGGTA AATCAACATT ATTTAATGCA ATAACAAAAG CAGGTGCTTT 420 

AGCAGCGAAC TATCCATTCG CTACGATTGA TCCTAATGTA GGGATAGTAG AAGTGCCAGA 4 80 

TGCTAGATTA CTTAAATTAG AAGAAATGGT TCAACCTAAA AAGACATTGC CGACTACATT 54 0 

50 TGAATTTACA GATATCGCTG GTATTGTGAA AGGTGCTTCA AAGGGAGAAG GGTTAGGTAA 6 00 

TAAATTCTTA TCACATATTA GAGAAGTAGA TGCGATTTGT CAGGTCGTTC GTGCATTTGA 660 
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TAATATGGAA 


TTAGTACTAG 


CGGACTTAGA 


ATCTGTTGAG 


AAACGTTTGC 


CTAGAATTGA 


780 


AAAATTAGCA 


CGTCAAAAAG 


ATAAGACTGC 


TGAAATGGAA 


GTACGTATTT 


TAACAACTAT 


840 


TAAAGAAGCT 


TTAGAAAATG 


GTAAACCCGC 


TCGTAGTATT 


GACTTTAATG 


AAGAAGATCA 


900 


AAAATGGGTG 


AATCAAGCGC 


AATTACTGAC 


TTCTAAAAAA 


ATG CTTT AT A 


TCGCTAATGT 


960 


TGGTGAAGAT 


GAAATTGGTG 


ATGATGATAA 


TGATAAAGTA 


AAAGCGATTC 


GTGAATATGC 


1020 


AGCGCAAGAA 


GACTCTGAAG 


TGATTGTTAT 


TAGTGCAAAA 


ATTGAAGAAG 


AAATTGCTAC 


1080 


ATTAGATGAT 


GAAGATAAAG 


AAATGTTCTT 


AGAAGaTTTA 


GGTATCGaAG 


AACCAGGATT 


1140 


AGATCgrTTA 


ATTAGGAmCA 


c t T ATGAATT 


ATTAGGnTTA 


TCCACCATAA 


TT 


1192 


(2) INFORMATION FOR SEQ ID NO: 69: 








(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7494 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 








(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 69: 






AATATAGCTG 


CAATAGCATC 


TCGTTTCATT 


TGTATAATCA 


ATTCCGGTTT 


AAATATCAGT 


60 


GTGAACGTAA 


GCACGACACA 


GATTAAAAAT 


AACACTGCCG 


GAATGAGTCG 


TTTCAATCGT 


120 


CGCTtCCAAA 


ACTCTAGCAA 


ATCGATTTTT 


TGCGTCCGAT 


AATACTCACT 


TATCAACAAA 


180 


CTTGTTATTA 


AATAACCTGA 


AATAACGAAG 


AATGTATCTA 


CTCCTAAAAA 


GCCCCCACTT 


240 - 


AACCATTGTG 


CATTCAAGTG 


ATAAATAATG 


ATTCCTATAA 


CTGCGAATGC 


CCTCAATCCA 


300 r 


TCTAATCCAG 


GTAAGTATCG 


CGGGGAATAC 


ATTTTTTCTA 


AACGTTTAAA 


GTCTTTTGTA 


360 — 


TCCA-fGTTAA TAAACGCCCC 


ATTTATTTTT 


CTCTATTTTG 


TAGTATATCA 


CAATATTTTT 


420 


GAAAATAAAA 


TATTGCACTG 


aTTTTCATTA 


ATTGATTTAA 


CCCTTAATTA 


AGATAGTTTT 


480 


AAATTTTTTA 


TTAAGTAGAA 


AACAATTATT 


ACAGTTGATT 


TCATTACTGC 


AAACCACATA 


540 


TAAATTTGTC 


GATTTTACTA 


CATAACATAG 


ATTATCATAG 


ATTCTTGAAT 


TTTTAGCAAA 


600 


ATAACTGTTA 


TTTTCATTAT 


ATTTTTACAA 


AAAAAGGTTC 


GTTTTATATT 


TTATGCATCT 


660 


TACTGTAACA 


GAATCATTAA 


GATATGCTAT 


TCGAATATAC 


TTTTTCAAAA 


TTTATATAAT 


720 


GAATAAATTA 


ACATGTATTG 


AAAAAAAAGC 


GAAATGCAGC 


CTATC CTCT A 


ATGTAAACCA 


780 


AACGATATAT 


CTCGTCAGAC 


TTTATATTTA 


AACGCTATGT 


GTCACTTTTA 


AAATGAATAT 


840 


TACTAAGATT 


GTCATATCAA 


TTATTATTGC 


ATCGAATTAA 


TCTTTTAAAT 


TTCTGTAATA 


900 
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ACGGAAGTCA TTATTAGAAT AAAAATACTG TGCACTAATA AATTT AT CAA TTGTTCCTAA 
ATAAATACCA TCGATATTTT GTTCTTTACA TGTCATTATA ACTTTATCTA AAAGTTTTTT 
ACCTATTTTT AAATTCCTAT AACCTTTATC AACAAACATT TTTTTAAGTG CAGACATATT 
ATTATCTAGT CTAATCAAAC CTATAGTACC AACAATATTT TGaTGATTGT TTATTGCAAG 
CCAAAATg CC CTCCATTATT CAAATAGTTA TGTTCGATGT TCTC CAAATC AGGTTGATCA 
TCTCTATCAA TTTTTATATa AATTCATTTT TTTGAATCGA TAAAATAAAC TCGATTAGCT 
CTTCCTTATA AGACCTATTA TATTCAATTA TGTTTATAGC CATTTTTATC TCCTTTTTCA 



1020 
1080 
1140 
1200 



^ J loiiLWiivji ili tuyy\iL AGGTTGATCA 1260 

1320 
1380 

is TTTAATTTAA TTATAAAATG TGCGTTTAGT TTGTATCTAG TGTACTCAGT ACAGCCTCAA 144 0 

ATGAAGTTTC ATTCCACTTG GCACTTAATA AAGACAAGTA TTTTAGCAGT AATACAATAA 
AGTCCAATAA ATTTCCCTAA CTTCAATATC CACTTTTTAA AAAATGTATT TTTAATTAAT 
AAAAAAACTC TCCCCAATTT CTATGGGAAG AGCTATATAT TTAATGTCTA AACATTACTT 
TTATTTATTA TGAAGGAATT AGAATCCCCA AG CACCTAAA CCTTGTGCTT TGTATGCTTT 
AACAGCTGCG TTGATTTGTT GGTCAACAGT GTTTGTTGGA CCCCAACCTG GCATAGTTTG 
GAATAAACCT GAAGCACCTG ATGGGTTGTA AGCATTTACT TGACCATTTG ATTCACGAGC 
GATGATTGGA GCCCATGTAG AAGCTGAAAC AC CAGTACGT TGAGCCATGA TTTGAGCTGC 
TGATGAACCA GTAGCACCTG CAGTATTACC ATTGCTTAAT CTCACTGAAC TTGAAGTAGT 
TGAAGTGCTG TAGTTATGGT AAGTTGGAGC TGAAACAGCT TCAACGTtTG AGTTACTTGA 
TTGTGCATTG TAGCTTACTG ATTGTACATT TGAACCTTGG TTGTATGAAG TAGTGTAGTC 
TGCACCTGCA ACGTTTGAGA AACCAGCAGT TTGACCATTA GCTGCTTCAT AGCTCCATGA 2100 
CCATGTAGTA CCATTTGAAG TGAAGTTATA TTGGAAACCA TCTTTTACAA AGTGGATGTC 2160 
ATATCCACCA TCTTTGATTG GAGCTGCATT TAATTGATCT TGGTGATTAT GCGCTAAGTC 2220 
40 AACTAAGTGT GCTTGATCAA CGTTTACTTC AGCAGCGTGT GCTTGATGTC CTGTACCTGC 22 80 

TGCGTAACCT GTTACACCTA ATGCCACTGC TAATGATGAT GCCATAATTG TCTTTTTCAT 234 0 

AGTAAAAAAT CCTCCAGTAA TAATTGTnAG TTTATGTTTT TAGTAATTAT AtTTTGaATT 2400 
45 TGAATGTCGT AGTgCAAGTT TAAATTGTCT TTTATTTCTT TCaACGGTAC TCACTATATC 2460 

ACAaAAAACC AGCCAGTAAA TTACACTTTC TTTACAAAAC ATTACAATAT CAAGTGTTAT 252 0 

TTG t AATGTT GAAATATGGC TGTTTTATAC TGTAATGTGA AATATGTGCC CTTTAGAATC 2580 
50 CAATCAACCC TTGAAATAGT CTTTAACACA TAAGATTTTT ACTATATTTA GCTCAACTAT 2640 

TACAGCTTTC GTAATATTAC AGATTGTATT TTTGTTACAT AG CTGTAAT A TATCTGACAT 2700 
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1500 
1560 
1620 
1680 
1740* 
1800 
1860 
1920 
1980 
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TACACATGTA TTGATTGCTA TTATTGTTGT 
GTGAATTGTC TTATCTTTTA TTAGCGCAAA 
5 TCATTCTCGC AATTCACAAT AACATTAAAT 

ACTGTTATTA TCCCATGAAT TTAAAAATAT 
AAATGATATC TGCAAG CCAA GCTGTTACAA 

10 

GTAAGACACT CAACCAAGCA GAATCAACCT 
CCATTCCTAT AAAACCAAAT CCAGCTGACT 

^ ATACCAAACC TGATACAATG GCTGTCGTTA 

C CAT ATTAGG TATCATCATT TTAACGCCTC 
GATTCACTTT ACTTGTACCA ATTATCAATA 

20 CTGATCCAGC TGCTAAACCT GTAATACCTA 

GCGAAATAAT AATAAGACTA AATACCATTG 
ATTCTGTAAA ACCATTAACC ATATTACCGA 

2S ATATTAAAAC ACCAATTGCA CCTGAAATAC 

CCATACTACC TACGCGATGT TGAATAAGTA 
TCATTGTATT AATTAAATCA CCAATACCCG 

30 

CTGCACCGCT TCCTACATAT GCTGCACTTG 
CAAATTTCAT GGCAACCAAT GCACCAATCA 
CAACG CCTAA TAACGTTTTA AAAATCGGAT 

35 

CAAGTATCGC ATTAGG AACT AAACCCGCAA 
TAAATATAAA ATCTTTGGGT GTAATTGTTT 
TATGTATATA CATCTGTATG CAAATAATAA 

40 

TAAATTCTAA GATGTGCATG CCGATGTTGT 
TCAAGACTAT GAAAAATAGT ATATCACAAA 

45 ATTTTTCAAA CATATTGTTA CAATACACTT 

ATACAATAGA AGAAAGACAT TCAAATGCTT 
TATCAGCaCT TACATATCAT CAACACAATT 

SO TGTTAAAACA ACAGATGTTA GGTAGTGAAC 

GAATCGTTAG AACCAAACAA TTGCTTGTCG 

55 



ATATTCAAAG TTTTAAAACA CACATCTTTT 2820 

TAAACTGCAG CTCAATTATA TTGTTCAACT 2 880 

AATTTTTGGT CTCATATTTT CAAAAAACAT 2 94 0 

CATTAGTATA TAAACGAAAC ACTTTACGAT 3000 

ATGGTACAAC AAAGAACGCT ACTACAATTA 3060 

CCATAAATTT AAATGCATTA ATCGGTCCTA 3120 

CTTTCGTTCC ATGAAT AC CT ACTAATGCTG 3180 

ATATTGGTAA CATAAGAATT GGATATTTCA 324 0 

CAAAGAAGAC GGATAACGGC ACCCCTAAAC 33 00 

CTGCTTCAGT CGCGGAGATA CCAATTGACG 3360 

TCGCAAAGGC AATGGCCACA GTTGATAGTG 34 20 

AAATCAAAAT ACTCATGACA ATCGGTTGTA 34 80 

TGG CTGTTGT AATCATTTTC GTATACGGCA 354 0 

CGCCAACAAC TGTTGGGAAT ACAATCAATG 3600 

AAATGAATAA CACTGCAATC GCTGCTGTAA 366 0 

TAATCATCCA AGCACCATTT TTAAACTGCG 3720 

CCACAACAGC AATTGCTAAT GGCGATAGGT 3730 

AAGCAGGTAC TGTAAATTGA ATTGCAACGA 3 84 0 

GATAATCCAT AAAGTATTTA AAAATTTCTC 390 0 

CAATACCTAT GGCGACACCT GATAAAACTC 3960 

TAATTGATGT CATAATATCA TCCTTCCATT 4 020 

AGAGCCTTAA GTTATAAGCT GCCACTAGCT 4 080 

TATATTTAGG CT AG CAGTAT CATCTATAAC 414 0 

ATTCTGAATT TTTAGATAAA TAAATTGGCA 4 200 

TTATTTTATC TTCATTTTTA AAATCCATTA 4 260 

ACCAAAAAGG TACATTATTT GTTAGGAGCG 4 320 

GACAATATAA TAGAAGATAC TGATAATAAG 4 3 80 

AAATGATGGA AAGTAAATCC ATAGATCCAA 4440 

ATGCTTTT CT TAAAATTTCT AGAGAAAAGA 4 500 
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TTTACGCTCA TTTCGCTGAT AAAGAAGACC TCCTAGACTA CACATTATCT GTAACCATTT 4 62C 

TAAAAGACTT GAATGATAAT TTGAGCATTT CTAATGTCAT TAATGAAAAG GTTCTGCGTA 4 68Q 

ATATTTTCAT TTCAATTGCG AGTTATATCA AAGATGCTGC AAAGTCTTGC GAATTAAATA 4740 

GTGAAGCATT TTGCAACAAA GCACATCAAC GTATTAATAA TGAATTAGAA GATATTTTTG 4 800 

^ CGATTATGTT AGAAAACAGC TAT CCGGAGC ATCAACGAGA TATCATTGTA AATAGTGCGA 4 860 

GTTTTTTAGC AGCTGGTATC TCAGGCTTAG CATTACATTG GTTTAACACG AGTCAAGAGA 4 920 

CAGCCGATGT GTTTATCGAT CGCAACCTTC CATTTTTAAT TCATCATATA GCACATTTTT 4 980 

15 AATAAAACTT GGTATTTAGT CATGCATCTT GAAATCACTA TGTGACTTAG GTTCATACTT 504 0 

GTACACACAA TAAAATTTAA CGTATTACGA TTGATTAGCC GTGTCTAGGA CATAAATCAA 5100 

CGTCCTATAC TCTACAATGT CATATTAGCA GTCGTTAACT GAATGAAAAT AAGCTTGTCA 5160 

20 TTAAAACATA TAGATTTTAG TGACAAGCAT TTTTGTTTTT GCGTACTTAA ACA ACACTTC 5220 

AGGCAATATG TTGTTTAGGC AACAAATGAT ATGTGCGTGT TTATTGGCAA ACGTACGACA 5280 

TAGTAGTATA GTATGTCTAA ACAACATATG TTGCATAGTT GATATGCGTT GTTTAAATAC 534 0 

TAAGATAGGA GGGATTGACG TGAGCGAGAC AGATGAACCT CAGGGGTTTG AACGCACGCA 5400 

TAATATATTA AATATTAATC AGAGTAGTCT GGGTGTAGTG ACATACATTA CAAATAAATT 5460 

AAAGTCGACG TTGAAGCAAC ACATAATAAT TGCTCGTGGT AAAAAGCGAA TCGACTATCG 5520 

ACTGTCGTAT AACTTTTACA TACGTATTAT GATAATGTAG AAATCAAGAA AATCGACTGT 5580 

GAATATACCT ATGCTATGCC CATTGCAATT TTAATAAGAC ACACGATGTC ATTCGACAAT 564 0 

GCTCATTTCT TTGCTCAGTT ACGTCATCCT GTCTTATAAA ACAACATTGC AGACATGTAT 5700 

ATCAAACGAC ACTTCAATAA CATCACTTTG CCcATCGTAC TACTAGTAAA ATCGTGTCTC 5760 

AAATCCCTTA TTTTAATTCC AAAAAtCTGC TGGTCAAAAG ACCGAGAAAC TAAAAACATT 5820 

40 ACTTAATGTG TTGATAAATT ACCATATAAA AATAATCTCA AAATATATCA ACACTTGATT 5880 

CTAAGGAGGA TATGACAATA TGAAAATTTT AGATAGAATT AATGAACTTG CAAATAAAGA 594 0 

AAAAGTACAA CCACTTACTG TAGCTGAAAA ACAAGAACAA CATGCATTGC GTCAAGAcTA 6000 

45 CTTAAGcATG ATCCGAGGAC AAGTATTAAC AACATTTTCC ACAATAAAAG TGGTTGATCC 6060 

AATCGGTCAG GATGTCACAC CAGATAAAGT TTATGATCTT CGCCAACAAT ACGGTTATAT 6120 

TCaAAATTAA tATTTGCTCA CGAGGTATTG CACTTAAGGT GCCAACTGAC CTCATAAACA 6180 

AAGCCCATAC TGATTGAAGA CACTAATGTG tCsaCCATGG TGCACATTAC GCTTCATCTC 624 0 
TGTATGGGCT TTTTATTTAT TCTTTTGAGA . ATTTCATTTT AGGAGAC CAA AAAATTAAAA 



6300 
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TGAACGACTG 


TGCCACCCGC 


TTCTTTCACT 


TTATTCACCA 


ACTGGTCAAC 


TTCTTCATTT 


6420 


GTGTTCACAC 


CTAGAGAAAT 


CATCACTTCA 


TTTGGTTCAG 


TATTAAGGCT 


TTGCTGACTT 


6480 


ACATTTTGAA 


AATGCTTGTn 


TTCTATTAAA 


ATTACGGkTG 


t TTGAC CTAT 


tTGAATGCCG 


6540 


ACCATTTTAT 


CTAACATTTG 


TGGGTTTCTA 


TTTATTTTAA 


ATCCTAACGC 


TTTATAAAAC 


6600 


TGTGCGCTCT 


TTTCTAAATC 


TTGCACATGC 


AAATTAAACC 


ACATTGATTG 


AATCATGATT 


6660 


GCACCCCATT 


CATTACTTAT 


TATAGTTTTG 


GACTTTAAGC 


CAATCACTTA 


ATGATAATCT 


6720 


TGTTGGATTT 


ATTTCAGCCA 


TTAATTCAAA 


GTCTACTTCA 


taaccttttt 


CTTCCAACCA 


6780 


TTGCTTTTCT 


GCAACACCAC 


TAACAAATTC 


TCCTTCTATA 


ACAGTAGATT 


TACCTGTCAC 


6840 


TTCACTAAAA 


ATTGTTGCTG 


CTTCACTTAA 


TGTAACTTCA 


TCGGAACCAA 


TCT CTATTGA 


6900 


TTGATGCGTA 


AAGCTTTGTG 


GATGTGCAAA 


AATATACGAT 


GCAATTTTAG 


CTATATCAAT 


6960 


AGAAGAAATC 


ATTGTGAATT 


TTATATTCGG 


ATTAATAAAT 


TCTGGTAATG 


TAATACGTTC 


7020 


ATCTTCGACT 


TTAG CAATGC 


GTAAAAAATT 


ATCCATAAAG 


AATGATGGTT 


TGATAACTGT 


7080 


TG CATTT AT A 


TTAGATTCCA 


TTAATCTATT 


TTCTATTTTT 


GCTAGTACTT 


CAAAGTGTGG 


7140 


GCCAGTTCGA 


TTTCGATTAA 


CCCCTCCCGC 


AGTACTATAC 


ACAATATGTT 


GAATATTTTC 


7200 


TTGCTCAGCT 


ATTTCAATTA 


TCTTCATACC 


TTGTCTTAAT 


TCTTCGCTAA 


CATCATCTTT 


7260 


AACGATTGGC 


TGAATACTGT 


ATAAGCCATA 


CTTACCTTTC 


ATCGCTGATT 


GCAAACTAAC 


7320 


ATTATCACTC 


AGATCACCTT 


CArCGATTGA 


TAAATGCGGA 


TGTCCTATGT 


CTGAAAGTTT 


7380 


ACGATTATnC 


TTATTTCTAG 


TTAATGCACT 


TACATACCAT 


CCATCCTCTA 


ACAACTGTTT 


7440 


TACAACTGCA 


TTACCTTGCT 


TCCCTGTTGC 


GCCTATTACn 


AAAATATCTT 


TCAT 


74 94 



(2) INFORMATION FOR SEQ ID NO: 70: 

- (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11802 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



4$ (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 70: 

AATTTATTTC GCCGTCCCAC CCCAACTTGC ATTGTCTGTA GAAATTGGGA ATC CAATTTC 60 

TCTTTGTTGG GGCCCcGCCC CAACTCGCAT TGCCTGTAGA ATTTCTTTTC GAAATTCTCT 120 

50 GTGTTGGGGC CCCTGACTAG AATTGAAAAA AGCTTATTAC AAGCGCATTT TCGTTCAGTC 180 

AATTACTGCC AATATAACTT CGTAGATCAT AGAACATTGA TTTATTTCCC AGCCTATTCT 24 0 
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AG CAAAGGTA ATAATGATAT TAATAATGTA CAAAAAATAT AAATCAAATC GACATCCTTA _ 36 

TAAAACATCA GAACCACTAA AAACAAAAAA GCACAAAATA AAATTAAATT TAAAATAAAC 42 

GACCACTTTT CAAAAAAATC TCtTTTCaTa TTTCCACCCC TAATTTTAAT AAG CATTATT 48 . 

TTATATTCTC TTTTAAGTTT ATTATTCAAA AGGAAAACAG AAATATCTTT CaATATTATT 54( 

, 0 ATAAACATTT CAACTACTTT TAAAAACCAA CAAAAAAATA CTTATTTTAA GTAGATGAGC 60 ( 

ATAAGTGAAC ATAGTTCTTT AGTTATAATA ATTAATTCAA CCAAAAGTCG ATTTGTTTTT 66( 

GCAATTGGTT TTCATTTCCT CTTAAAGATA TTTTCATTAA ATCTGTCAAA TCAATAGACG 72( 

,5 CTATATTTTT CAACTTATCT CTATATTTAT TTTTAGTACG TCTTTCTAAA TTTCCCCATT 78( 

CCTCTTCTTC GTGAGTTAAT AAATGAAGCA TTGCTCGTTC TTGTATATTT TCAATCATTT 84 C 

TTAAATTCGG TTTTAAAATA TGCAAATCAT CAAAACAATC TTTCCAACAA TCAACCATAT 90c 

CTCGTTTTAA TTCAATTTCC ACACGCCATA GAAATGTTGA ATCAATTTCA ACATCTGCAT 960 

TATCTTTACG TTCTTGTTTT TATTATAAAT CCGAATAAAC CTATCACTAT TACGCACACC 1020 

^ AAAATATTTT GTTTCTGGTT TTACATTACG TCCATAAAAT ATAGTTTTCT TTACCGACTT 1080 

ATCTGACAAT GCATAATAGT CATTTAAATC AAATTCAAAA TCAAAAGCCA AATCTAATCT 1140 

CGTAAAACTA ACATCGTCCA AATAACTGAT GATATTTTGT TTTAACCAAA GCACTTCATC 1200 

3fl ATGCGAAAGC TTATTAGGAT TAAATTCAAC GCGCATAtAC GTCTATTCCA AAGAGTTGCT 1260 

TTTATTTTGT CATATTCAAT ATAAACTTTT TCTTTAAGAG CTTTAGCTTT AAAGTTTGTT 1320 

TGTAAAATAT CCCAAAGCCG AATTTCAGGA TTAGTACTCA TAAAATGTGA AAGTCTCTCT 1380 

35 GCGTTAGACA TGCTAAGATT CCCAACAATC GTTATAGCGT CAAAAGACAA TTTTGGAATA 144 0 

GCTAGTGACA TCCTATGTCG ATTTAACCGG CTATTAC CGG ATATTAGAGT ATCCAGTTTT 1500 

ACAAATGGAT GAAACGAAAT TCAAAACACT AAAAAATATG TTCCACTAAC AGCAAAAAAA 1560 

40 - 

TACGATTATG TTCCTACTAA AAAACyAAAA ATACTGGAGA ACAAATGTCA GGATATAACT i 6 20 

TAGGATACTA TGTAATAAAA ATTTACAATA AAAAAACAGG AAAACAAATT TCAAGTAAAA 1680 

4S GmATACCCAT. ACAAAGAGGA TAAAATAAAA AACCTCGAAC TGaAATGATG ATCTTTTCAG 174 0 

CTCGAGGTTT AAATATTGGT GCCTTATTTA TATAGATTCG TTATATTATA TTCTCTATTT 1800 
TCATTAACmT AATCCTTAAA GAGTTTTAAA TTAATACCTG CTAGATGATT CAAAAATGTT 

so TCATCAACTT TTAAATAATT CAATAATTTT TGTGGTGTCA GTAAATnTCT ATCAAAATAC 

AACTTTAATA AACTATTCAT TTTGACAGGA CGTGACATTT CAATCACGTC GTCTAAAGAT 1980 

AATACTTTCT CGCTTTAnAC AAAnACAAAA ACTTACCCGA TTAAAATCAA GTAAGTTTTA 204 0 
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TATTTGATAA AAAATCAATA AGTAATTGTG CGCCTTCAAC TTGAATATCT TTTACAACTG 2160 

GCGCGTCGAT ATACATATCA TACTGACCAC CGCCTACTGC ACGATAATTA TTTACACAAA 2220 

TTGTATATGT CTGCTTTAAA TCAACTGCGT GACCTTGAAT CATCATATTG CTCACACGTT 2 280 

GTCCCTTTGG TCTTC CAACA TGAATGGTAT AACTTACGCC ACCATATATA TCATAATTAA 2340 

AGTGTTGTGG TTTGGGTTCA AGGAAGTCTG CGCTCACACT AACTTCATCA TTTTTCACGT 2 4 00 

CAAAATATTC TGCTGATCGT TCAATGGCTT CTTTAAGTTT GGCACCACTT ACAGCTAAAA 24 60 

CTTTAAATGT ATTTGGAAAT GGGTAATTGT TAATAACATC TCGCATCGTC ACGACTTGCT 2 520 

75 TGAAACCACT AGCAGAATCA AACAAAGCTG TACAGGCAAC ATCTGCGTCA CTTTTTTCTA 2580 

ATAAAGCGTA ATTCATAAAA TTTGTAAAAG GATGCGGTGC CACACGTGCC TCAAATGCAT 2640 

GATTAATCGT CATATCATAT GGCAATGTAG TAATTTCGTA ATCTAAC CAG TCCTCTAACT 2700 

GCTTTCGTAA ATGTTGGTCA TCTTCATCAA TAGTAAATGT GGAATCATCT ATAACAGGAA 2760 

GTAATTCACA TGATTCAACG GATAGATTTT CAT ATT CATC AGTACTCAAG ACTACTCTGC 2 820 

CTACAGTTGT ACCTCTCGTA CCAGGTTGAA TCACAGCCGT TTGCTTAAAC CTTTCAGCAA 2 880 

TTTGTCGATG TTGGTGACCC GTAATAAAGA TATCTATATC TTTAGAAAAC GCTTCTAACA 2 94 0 

TGGCATATCC TTCATTTTCA CCCGTTAATA CTTCGGTCGG CGTACCACTT TCTAAATCCT 3000 

TTTCAAATCC ACCATGGTAA CAAACCACAA TGATATCTGC ATGTCGCTTC ATTTCAGGTA 3060 

AGTATTGTTG AAGTATTTCA AAAGCACTAT GAAACGTArT GnCnTGAATA TGCTCTGGTT 3120 

GTTCCCAATG GGGAATAAAT TGTGTCGTTA AACCTATCAC ACCAACAGTT TGATCTCCAA 3180 

35 CCTGAAAATA CTTCACACCG TTATCAGT CA ATGTACTATC ATTTTCATAT ATATTAGCGC 3240 

ACAAAACTGG ATAATTGAGT CTGCGTAAAG TGT C TTTTAA GTATGGTAAT CCATAATTAA 3300 

ATTCATGATT ACCAAG CGT A CCAAAGTCGA ATGCCATTCG ATTATAAAAA TCAACTAAAG 3360 

GCTGGCTACT GCCGCTATGC GCGATTAAGT AATTACAAAA TGGTGACCCT TGCAAAAAAT 34 20 

CACCATTATC TATTTTAAAA CTTTGGTCAT ACTGCCTTCT GTsTTGTTCT ATAACATGAT 34 8 0 

TCGCTAGTAA CAATCCCATA GGTTGATATT GATTTCTACT CGTAAAATCT GTTGGGAAAA 3540 

TATAACCATG TACGTCACTC ACGACATAAA ATGCTATGTT TGACATCCTC ACTCACTCCT 3600 

TCAATCACAA ACATCTTTCT TATTTCTATT ATATATTTAT TTGAAGTCTG TTGTAATCAA 3 66 0 

so GGTTTTGTCA CCGAGTTTTA AACGAATCTT TGAACCTTCC ATACTTTCAA GTACTTTAGC 3720 

ATTGACCTTA ATTGTGACAT TTCCGTTTTC ATCTGCTTTA ACTGTTGGCA AAGTACTGTA 37 80 

ACCTGGTGGG TTATAATCGT TAT C TTT A CT TGAAAATTGT CCGATTTGAC GTCCGCCTTC 3 84 0 
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TATTGTCATT TCAAATGGCT CATTTACAGA AACATTTTGC GGGATATCAA ATGTTACTTT 39 , 

TTCGTTCTGA TTTGGTGGTG TATGATCATC TGGTGTGTTT GGCTGAGGAT CTGCGCCTTT 402 

TTCGCTGCCA TAACTACCTG CTTTAAATGT TGTTGGATCA TACCATTTAT AACCACTCGG 408 

CGGTTGTGAC CATGGCTCTT TTTCAGGCTC AGTTGAACGC TCTGGTCGTT CAAAATCAAG 414 

w CAACTTAGTC TTTGTATCTA ATGTTAGGCT ACTCGCCTTA AGTGATTTCC CATCATTATC 420 

TTTAGACATC CAAGCCGTTA TATTATTTAA TAGCTTACCG TTGTCTTGTT CTTTAAAACC 426 

ATCATATGTT TTCTTCTTTT CTCCATTATC TTCTCTTACA TATTTGGGCG AACTATCTTC 432 

CACAAGTGAT GAATCACCGA TAAATGCTGC TTTACCTTTT CCAACTTTAG AAATTG CTAC 438 

ATAGGGGCCT TCTGCTTTAC CGCCCCCATT ATAAATACCT TGATCTA'CAG CATGTGACCA 4 44< 

TTTACTTTTC GCTGGCAATT GTTCTGGTGT ATACACAATA CCTTTTGCTT TCTCTGGATT 450 ( 

AGTAATTGCT AATGTCGATC CGGCATGCAT AGAGACAGAT TTCACACCTT CAGTAATACC 456 ( 

GAAACTTTCT TTTGAAGAAA CAATATTGCT CGTATTTAAA TCACCTAGTG CATTATATCG 462 ( 

AAAACGTACG CCAAAGTTTG TAGATAACCA ATCTGAACTT TTCACACCTT GCATTGCAGT 4S8C 

AGAACTTTTT TCTTCTGCAT TCATACCTTT CGACATATCT TCATATGCTC CACGTCGATA 47 4C 

ACCATTCATT GCCTCCGATG AATGAATACG ATTTAAATTT CGGTCAGCAT TGTAATGATC 4800 

TGAAATAAAG ACAACATTGC CACCTTGTTt CACATATTTA ACAATTGCTG CCTGTTCTGA 4860 

TTCTTTGAAA GGAATGTTAG CCTCAGGAAT TACAAATATT TTGGAACTTT TCAAACTTGC 4 920 

TTCTGTTATG TTCGAATGAC CATCAATAGC TTTAACGTCA TAACCTTGTT TTTGTATTGA 4980 

ATCCGCATAA TCTGAAAATG CACCATCACT AACCCAATCT GCAGCACCAG CTGTTTGACC 5040 

ATGAGAACGA TCGAATAATA CCGTTCGCTG TTGCTTTGTA GGTTGCGATT CATG CGTTAT 5100 

AGCTAAAGAT TGCGGTAAAG CACTTAATGA TACCGTTGCA ACAATTGCAG AGACAGTTAA 5160 
— TGACTTATAT ATTTTTTTCA TTTTGTGAGG CTCCTTTTAA AATAAATTTG TTCTTGAATT 
ATAGGATAAA AATTCGTTGC ATATGAGCAA TTTAACGAAA AATTTACAAA ATCTTATCAA 
45 ACTCTTAAAG AAAGTTATTA AAATTCATTT TTATAAAATA CTTTTTAACA TTTAAATGTG 
GTACGCTATA AGTGTAATTT CATTGCATAC ATATTACACG ATTAAGAATG TGAAGGGGAC 
AGTTATCAAA TGAAAAATTT TAAGTGTTTA TTTGTATTAA TGTTAGCAGT CATTGTTTTT 
50 GCAGCAGCAT GTGGAAACTC AAGTTCTTTA GATAATCAAA AGAACGCTAG TAATGATTCG 
GATTCTAAAT CAGGAGGATA CAAACCTAAA GAATTAACCG TTCAATTTGT ACCTTCGCAA 
AATGCTGGAA CATTAGAAGC TAAAGCAAAA CCATTAGAAA AATTACTATC TAAAGAATTA 
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TCTAAAAAAG TTGATGTTGG TTTCTTACCA CCAACGGCAT ACACATTAGC ACATGATCAA 5760 

AAAGCAGCTG ATTTATTATT ACAAGCACAA CGTTTCGGTG TAAAAGAAGA TGGTTCAGCA 5820 

5 

AGTAAAGAAC TTGTAGATAG TTATAAATCA GAAATTCTTG TTAAAAAAGA CTCAAAAATT 58 80 

AAAAGCTTGA AAG AT TT AAA AGGTAAGAAA ATTGCCTTAC AAGATGTAAC ATCAACTGCT 5940 

GGATATACAT TCCCACTTGC GATGTTAAAA AACGAAGCAG GTATTAATGC AACTAAAGAT 6000 

W 

ATGAAAATTG TGAATGTTAA AGGTCATGAC CAAGCAGTTA TCTCATTATT AAATGGAGAt 6060 

GTAGATGCTG CGGCTGTATT TAACGATGCA CGTAATACTG TGAAAAAAGA CCAACCAAAT 6120 

75 GTATTTAAAG ACACACGAAT TTTAAAATTA ACACAAGCTA TTCCGAATGA CACAATTTCT 6180 

GTAAGACCAG ATATGGATAA AGATTTTCAA GAAAAATTGA AAAAAGCTTT TATAGACATT 624 0 

GCTAAATCAA AAGAAGGTCA CAAAATTATT AGCGAAGTTT ATTCACATGA AGGATACACA 63 00 

on 

GAAAGGAAAG ATTGAAATTT CGAGATTGTA AGAGAGTACG AAAAATTAGT TAAAGATATG 63 60 

AAAT AAT CAT TATTTAACAA ATGAATCATT AG CG AATTTG GTATTAAAAG CTTTCGTTCA 6420 

ATAGATATAT TCTAGATTAA TATTGAAAAG CTAGGCGCTA AACTGAAACA GATATAGAAA 64 80 

2$ 

GGTGTCGCTG TACATTTGAA ACCATTTGTA CACAGAAACC CAATGTCTAT GATATTTCAG 654 0 

TTTACCTTGG CTTTTCTTTA TTAAAGAAAG GTGTCAAACA TGAGTCAAAT CGAATTTAAA 6600 

30 AACGTCAGTA AAGTCTATCC TAACGGTCAT GTAGGCTTGA AAAATATTAA CTTAAATATT 6660 

GAAAAAGGTG AATTTG CAGT TATTGTCGGA CTATCTGGTG CTGGGAAATC CACGTTATTA 6720 

AGAT CTGTAA ATCGTTTGCA TGATATCACG TCAGGTGAAA TTTTCATCCA AGGTAAATCA 6780 

35 ATCACTAAAG CCCATGGTAA AGCATTATTA GAAATGCGCC GAAATATAGG TATGATTTTC 6840 

CAACATTTTA ATTTAGTTAA ACGGTCAAGT GTATTACGAA ATGTACTAAG TGGACGTGTA 6900 

GGTTATCACC CTACTTGGAA AATGGTATTA GGTTTATTCC CAAAAGAAGA CAAAATTAAG 6960 

40 

GCAATGGATG CACTAGAACG CGTCAATATC TTAGATAAAT ATAATCAACG CTCTGATGAA 7020 

TTATCAGGTG GCCAACAACA ACGTATATCT ATTGCACGTG CGCTATG CCA AGAATCTGAA 7080 

ATTATTCTTG CAGATGAACC AGTTGCTTCA TTAGACCCAT TAACTACGAA ACAGGTTATG 714 0 

45 

GATGATTTAA GAAAAATCAA C CAAGAATT A GGCATCACAA TTTTAATTAA TTTACATTTT 7200 

GTTGACTTGG CAAAAGAATA TGGCACACGC ATCATTGGTT TACGTGATGG TGAAGTTGTC 7260 

SO TATGATGGTC CTGCATCTGA AGCAACAGAT GACGTATTTA GTGAAATATA TGGACGTACA 7320 

ATTAAAGAAG ATGAAAAGCT AGGAGTGAAC TAACATGCCT TTAGAAATAC CTACAAAGTA 73 80 

TGACTCCCTT TTAAAGAAAA AGGTTTCTTT AAAAACGAGT TTTACCTTCA TGTTAATCAT 744 0 
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AATACCTCAA ATAGGTGATC TATTCAAACA AATG ATT C CA CCTGATTTCG AGTAITTACa" 
ACAAATTACA ACGCCAATGT TAGATACCAT TCGAATGGcT ATCGTAAGTA CAGTATTAGG 
TAGCATCGTT TCAATACCAA TTGCGTTATT ATGTGCTAGC AATATCGTTC ATCAAAAGTG 
GATTTCAATA CCCTCGCGCT TTATTTTAAA TATAGTTCGT ACTATTCCAG ATTTGTTATT 
w AGCAGCAATC TTTGTGGCTG TATTTGGAAT CGGTCAAATT C CAGGG ATAT TAGCACTGTT 

TATTTTAACT ATCTGTATTA TTGGAAAATT ATTATATGAA TCATTGGAAA CGATAGATCC 
AGGTCCAATG GAAGCAATGA CGGCTGTTGG CGCTAATAAA ATAAAATGGA TTGTTTTCGG 
JS TGTTGTACCA CAAGCCATAT CGTCATTTAT GTCATACGTA TTATATGCAT TTGAAGTAAA 

TATACGTGCT TCAGCTGTGC TTGGATTAGT CGGCGCTGGC GGTATTGGAT TGTTTTATGA 
TCAAACACTT GGTTTATTTC AATATCCAAA AACAGCAACG ATTATTTTAT TTACTTTAGT 

— ... «xwwx«A Ai acaiCaGTaC GAAAGTGAGG gcacatctcg catgacacag 

GAAATAGCAA AATATAATGT TCACACAAAA GCACAGAAAC GAAAATTGAT TAAAAGATGG 

CTTATTGCAA ttgtcgtctt agctattatc atctgggcat ttgcaggtgt accaagttta 

GAACTTAAAA GTAAATCATT AGAAATCTTA AAATCCATAT TCAGCGGATT ATTCCATCCT 
GATATCAGCT ATATCTATAT ACCAGATGGC GAAGACTTAT TACGTGGTTT ACTTGAAACC 
30 TTTGCGATAG CCGTTGTAGG TACTTTCATC GCCGCAATTA T CTGT ATTCC ATTAGCATTT 

CTAGGTGCAA ATAATATGGT AAAGCTACGC CCAGTTTCAG GTGTTAGCAA ATTTATTTTA 
AGTGTTATAC GTGTCTTCCC AGAAATTGTA ATGGCACTTA TATTTATCAA AGCTGTTGGC 
35 CCAGGTTCAT TTTCAGGTGT ATTAGCTTTA GGTATCCATT CCGTAGtATG CTTGGGAAAC 

TTTTAGCTGA AGATATTGAA GGTCTAGATT TCAGTGCTGT AGAATCATTA AAGGCCAGTG 
GTGCEAATAA GATTAAAACA CTCGTATTTG CAGTCATACC ACAAATTATG CCTGCCTTTC 
TATCACTCAT ACTTTATCGC TTTGAACTAA ACTTACGTTC AGCTTCTATA CTGGGGCTAA 
TTGGGGCTGG TGGTATCGGG ACACCACTCA TATTTGCCAT TCAAACACGT TCTTGGGACC 
GTGTAGGTAT TATATTAATC GGTTTAGTAC TAATGGTCGC AATTGTCGAT TTAATTTCCG 
GTTCAATCCG AAAACGTATT GTTTAACATT AAATCAGGAT ACTCCTAAAT AAGAAGTCCT 
ACCGTCTTAC GTTTCTCTAT TATAATAAAA ACAGCAGTGA AGAAAACTAT TGTTATAGTT 
so AACTTCACTG CTGTTTTTAT AATATCTAAA TTTATTCTAT TTCAATTCCT TTAAATAACT 

TTTACCGAAC TCTGGTAATG TTACGTTGAA ATTATCTGCT ATAGTTGCAC CGATAGAACT 
GAATGTAGTA TCACTTTCTA GTGCATGACC ACCTTTAAAT TTCGGACTGT ACATAATTAC 
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TGTAATAATT ACTAAATCGT CTTCTTTTAA GTTGCTAAAC AGTTCTGGCA AGCGATCATC 9360 

GAAATCTTTA ATTGCTTGTG CATAACCTGG TTTATCACGA CGATGACCGT ATAATGCATC 9420 

AAAGTCTACT AAGTTTAAGA AGCTAATACC TGTGaAATCT TTCTTAACAA TTTTCATCAA 94 80 

TTGAT CCAT A CCGTCCATGT TACTCTTCGT ACGAACCGCT TCTGTTACAC CTTCACCATC 954 0 

ATAAATGTCA TTAATTTTAC CGATGGCAAT AACATCATAA CCACCGTCTT TCAAATGATC 96 00 

TAAGACAGTT TTACCAAAAG GTTTTAACGC ATAGTCATGT CGATTAGATG TACGTGTAAA 966 0 

GTTTCCTGGT TCACCAACAT ATGGACGTGC GATAATACGA CCAATTAAAT ATTTAGGGTC 9720 

15 TTTTGTCAAC TCACGAACCT TTTCACAAAT ATCATATAAC TCTTCTAATG GGATAATGTC 9780 

TTCATGTGCA GCAATTTGCA ATACTGGGTC TGCACTTGTA TAAACAATTA AGTCACCAGT 984 0 

TTTCATTTGG TGCTCGCCCC ACTCATCGAT AATTTGCGTA CCCGATGCCG GTTTGTTAGC 9900 

20 AACAACTTTA CGACCTGTCA TTTCTTCAAT TTGTTGAATT AACTCTTCAG GGAATCCATT 9 96 0 

AGGGTATACT TTAAAAGGTT G CAT AATATT TAATCCCATA ATTTCCCAGT GACCAGTCAT 10020 

TGTATCTTTA CCAACTGAAG CTTCACTCAA TTTAGTATAG TATGCTTCTG GTTGTTCAAC 10 0 80 

TGCATTTACT ACTGGTAATT TATCGATGTT CCCTAGACCT AACTTTTCAA GGTTTGGTAA 1014 0 

AGTTTGATCG AAACCTTCTA AGGTATGTCT TAAAGTATGT GAACCTTCAT CTTTAAAATC 10200 

AGCTGCGTCT GGCGCTTCAC CAATACCTAC TGAATCCATT ACGATTAAAT GTACACGATT 10260 

AAATGGTCTT GTCATAGCTA TCACTCCCAA AATTTATATA TATTAGTAAT CTGAATCTGC 10320 

TTCTAAACCT TGCATAATTT GAACACCTGC GCTCGCACCA ATACGTGTCG CACCTGCTTC 103 80 

AACCATTTTA TTGAAATCTT CTAAATTACG TACGCCACCT GATGCTTTTA CTTCTACATC 10440 

AGCACCTACT GTATCTTTCA TTAATTTAAC GTCTTCTGCA GTCGCACCGC CACCTGCAAA 10500 

ACCTGTTGAA GTTTTAACGA AGTCCGCACC AGCCGCTTTT GTTAATTCAC TCGCTTTTAC 10560 

40 AATTTCGTCA TGGTCCAACA ATACCGTCTC AATAATCACT TTTACTGTGT GACCTTTCGC 10620 

AGCTTTAACC ACTGCTTCAA TGTCTTGTTG TACATCATCA AAACGTCCAT CTTTTAATGC 106 80 

GCCGATGTTG ATGACCATGT CAATTTCATC TGCACCATTT TGAATTGCAT CTTCTGTTTC 10740 

AAATGCTTTC GTTGCAGTTG TCGACGCACC TAATGGGAAT CCTATTACCG TACAAACGAG 108 00 

CACCTCTGAA TCAGCTAGTC GCTCTGCTGC ATATTTAACA TGTGTTGGAT TCACACATAC 10860 

AGATTTAAAA TTGTATGctT TCGCTTCATC GATGATTTGA TCGATTTGCG TACGTGTTGA 10920 

CTCAGGCTTC AATAAAGTGT GATCTATATA TTTCTCAAAT TTCATACTTA CTACTCCTCG 10980 

TGTTATATAA TCTCTTTATT TAATTTTACT ATAAATACGA ATATATCTCG CGAATTTATA 11040 
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ATACT CATT A AACCTAAAAT AATTAAAATA ATACCGAAAT GTGAACTTAA TGCATCATTG 
CCTGGGAAAT TTAATGCTTT AAAATCGATT AGAGCCGCAG CAATCGCAAT ACCTACAGAT 
ACCGCCACAT TAATAATTAA ATTATAAAAA CCAATAGCCA CACCTGTCAT ATTAAGATCT 
ATTGTTTTAA TGGCTTCGTT AAGTAAAGGT GCATACATTA AAGCAAAGCT ACCTGCAAAG 

w AATATCATAG AAATGACGAA GATTGAAATG TGATTACCTA CTGCAAATGC AGGTAAAATC 

AAGCTCAGTG CTATTAAAAT AATTGCTGTG ATAATCGCTT GTTTTGAATT CAGATATTCG 
CCGATTTTAC CACTTAGTGC ACCAACAATG ACTGCTACTA TATAACCCGG TACTAATAAC 

is AGTGATGTTG TGTCTAGTTG CAGATGATAA ATTTGCTCCA TTATGAATGG GAACGTAAAA 

ATATAACCCA ATTGGATAGC ATACATTACA AATACTATAA ATAAAAATGA AGCATAACGT 
TTATTTTGGA AAAATGATTT ATTTACTAAT GGACGTTGCG CATTTTTAAT ATATAGCGCA 

20 

AAAACGATAA TCGCAATTAA GC-CACCAATC ATATATAACC AATTAAAGTT CGTAATAAAC 
AGCATGACTG TTGTAGCAGG GGATCCTCTA GAGTCGAnCC TG 
(2) INFORMATION FOR SEQ ID NO: 71; 



2S 



30 



40 



45 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1196 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 71: 

35 CTAAAGAAGA TGCGAAACAA GATGTTGATA AACAAGTTCA AGCTTTAATT GACGAAATCG €0 

ATCAAAATCC AAATCTAACA GATAAGGAAA AACAAGCACT TAAAGATCGT ATTAATCAAA 120 

TACTOCAACA AGGTCATAAC GACATTAACA ATGCGATGAC AAAAGAAGCA ATTGAACAAG 180 

CAAAAGAACG TTTAGCGCAA gCATTGCAAG ACATCAAAGA TTTAGTGAAA GCTAAAGAAG 240 

ATGCGAAAAA TGATATTGAT AAACGTGTAC AAGCTTTAAT TGACGAAATC GATCAAAATC 300 

CAAATCTAAC AGATAAGGAA AAACAAGCAC TTAAAGATCG AATTAATCAA ATACTTCAAC 360 

AAGGTCATAA CGACATTAAC AATGCGCTGA CTAAAGAAGA AATTGAGCAG GCAAAAGCAC 420 

AACTTGCACA AGCATTGCAA GACATCAAAG ATTTAGTGAA AGCTAAAGAA GATGCGAAAA 480 

so ATGCAATAAA AGCCTTAGCT AATGCGAAgc GTGATCAAAT CAATTCAAAT CCAGATTTAA 54 0 

CACCTGAGCA AAAAGCAAAA GCGCTCAAAG AAATTGACGA AGCTGAAAAA CGAGCACTAC 600 

AAAACGTTGA GAATGCTCAA ACT AT AG AT C AATTAAATCG AGGATTAAAC TTAGGTTTAG 660 
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TTGAAGCAAC ACCTGAGCAA ATCCTAGTTA ATGGTGAACT CATTGTACAT CGTGATGACA 
TCATTACAGA ACAAGATATT CTTGCACACA TAAACTTAAT TGATCAGCTT TCAGCAGAAG 
TCATCGATAC ACCATCAACT GCAACGATTT CTGATAGCTT AACAGCAAAA GTTGAAGTTA 
CATTGCTTGA TGGATCAAAA GTGATTGTTA ATGTTCCTGT AAAAGTTGTA GAAAAAGAAT 
TGTCAGTAGT CAAACAACAG GCAATTGAaT CAATCGAAAA TGCGGCACAA CAAAAGATTA 
ATGAAATCAA TAATAGTGTG ACATTAACAC TGGAACAAAA AGAAGCTGCA ATTGCGnAAG 
TTAATAAGCT TAAACAACAA GCAATTGGAT CATGTTnAAC AATGGCACCT GGATGTTCCA 
TTCAGTTGAA GGAAATTTCA ACAACAAGGA ACAAGCGCCn GATTGGAACA ATTTGA 
(2) INFORMATION FOR SEQ ID NO: 72: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1519 base pairs 

(B) TYPE: nucle ic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 72: 



CAATCGTTTC 


AACGCTATTA 


TCTTTAGACA 


ACAATTGTAA 


GCGTGTATGT 


GCAGTTTCTA 


AACAGTCTAT 


AATTCGAGTT 


CTTAATTCAG 


CTGGATCATC 


TTTAAAAATA 


AAATCCATCG 


CTGCAACTTT 


GTAGACAAAT 


GTTAAATAGG 


TAAGTTCACT 


GTGACTCGTA 


ACGAAAATAA 


TGTTACCAAC 


TGGGTCATGC 


TTACGAATTT 


CACTGCCTAA 


TTTGATACCA 


TTAATATCAG 


TTGAAAGTTG 


AATATCTAAA 


AAGTAACAGC 


CTATGTCATT 


CATATTTTTA 


GCTTGCTCAA 


GCACCTCATA 


AGGATTATCA 


GTTGCGAGGG 


CAATTTCCAT 


AGGCTTTTCT 


TCTATCATTA 


TATAATTTTT 


AATAATGGTA 


ACCA'lXmTT 


CTCTTTGTTT 


TGGATCGTCT 


TCGCAAATGA 


AAATTTTCAT 


ACATTCACAT 


CCTTATGGCT 


AGTTGTTAAT 


AATTTCAACT 


TTTTGAATAA 


AGAAACCATT 


TTCGATAATT 


GTATCTAATA 


AGACATTGTC 


TGCATTATCA 


GCAATTTCTT 


TTAAAGTTGA 


TAGACCTAAA 


CCACGACCTT 


CACCTTTAGT 


AGAAAAACTT 


TCTTGGAACA 


ATTCATGAAT 


GCGTGGTATA 


TCATCAGCGC 


ATTTATTCAT 


AACAATAAAC 


GTTACTGAAT 


TTTCACTTTC 


AATAAATGCA 


ACGCGAATGA 


TAGGGTCATC 


AATTTCAGTT 


GATGCCTCAA 


TTGCATTATC 


AAGAATAATA 


CCAATACTGC 


GACTTAAATC 


GATCATATTC 


AAGTTAATGC 


TACTTACTTC 


ATCGGGTATT 


TCGATACTAA 


TCGGAATATT 


CATTTCTTGT 


GCACGTAAAA 


TTTTCGCAGT 


AATTAAGCCT 


TTAATTTCAC 


GTACTTTAAG 


ATTCTCGATA 


CCATTTAATT 
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GTAGGCCAGG CATGTCATCT TCTCGAATGT ATTCTGAAAG TGTCGTTAAG ATATTGACAT 
AATCATGACG GAACTTGCGC ATTTCGTTGT TGATAGCTTC AATCTTCAAT GTATATTCAT 
AATAGGTTTC AATTTCTTCT TGATTACGTT TATATTTCAT CTCTTTAAGG AGAAATTGAG 
AAATAACAAA TGTTAATATA CTTAAAAATA TAGTGATACC AATAAAAATA AAAGAATACT 
GCCTTATTAC TTTAGCTTCA TCCGAGTTTA TTTGTGAATA AAAGAAAAAT AATGAAAAAG 
TAAGCAGTAA GATAGTCGAA ATAACTATTA AAAATCCTTT GTTTAGTATT AGATATGGTG 
TGCTAATTTT TTTGAGAACT CTATTTATTA TATATGAGAA TAGTATACTA ATAGTCACAT 
(5 AAACTACAAA AAAGCTAGGG AATATTACAA ATATACTATC AGAAATTTTG GTGGATATAT 

GCATATATAA CTATATACCT GTAGTTAGCA CnGTnATAGG AATAATCnGG CGAGGTCCAT 
AATCCACCAA AATAGAATA 
2Q (2) INFORMATION FOR SEQ ID NO: 73: 



10 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH.- 544 5 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
2S (D) TOPOLOGY: linear 



35 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 73: 

GTAGGAATCT CTTTGTCTTT TTGGGAGGAC ATTTAATATG AATGTATATT TAGCAGAATT 60 

CCTAGGAACT GCAATCTTAA TCCTTTTTGG TGGTGGCGTT TGTGCCAATG TCAATTTAAA 120 

GAGAAGTGCT GCGAATGGTG CTGATTGGAT TGTCATCACA GCTGGATGGG GATTAGCGGT 180 

TACAATGGGT GTGTTTGCTG TCGGTCAATT CTCAGGTGCA CATTTAAACC CAGCGGTGTC 24 0 

TTTACCTCTT GCATTAGACG GAAGTTTTGA TTGGTCATTA GTTCCTGGTT ATATTGTTGC 300 

40 TCAAATGTTA GGTGCAATTG TCGGAGCAAC AATTGTATGG TTAATGTACT TGCCACATTG 360 

GAAAGCGACA GAAGAAGCTG GCGCGAAATT AGGTGTTTTC TCTACAGCAC CGGCTATTAA 420 

GAATTACTTT GCCAACTTTT TAAGTGAGAT TATCGGAACA ATGGCATTAA CTTTAGGTAT 480 

45 TTTATTTATC GGTGTAAACA AAATTGCCGA TGGTTTAAAT CCTTTAATTG TCGGAGCATT 540 

AATTGTTGCA ATCGGATTAA GTTTAGGCGG TGCTACTGGT TATGCAATCA ACCCAGCACG 600 

TGATTTAGGT CCGAGAATTG CACATGCGAT TTTACCAATA GCTGGTAAAG, GTGGTTCAAA 660 

TTGGTCATAT GCAATCGTTC CTATCTTAGG ACCAATTGCC GGTGGTTTAT TAGGTGCAGT 720 

GGTATACGCT GTATTTTATA AACATACATT TAATATTGGT TGTGCAATTG CrATTOTTGT 780 



SO 
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CGAATCAATT TACTAAAATA AAAAGAAACG TAAATAGCAT AATTTAACAT GTTTGATTCA " 900 

TGGATTATGC TATTTTTTCG CCAAAATTTA ACAGATTTTG TACAATGGGT TAGCGATTAT 960 

TTTTTAATAA AGGAGATACT ACTAATGGAA AAATATATTT TATCTATAGA CCAAGGAACA 1020 

ACAAGCTCAA GAGCGATTTT ATTCAATCAA AAAGGGGAAA TTGCAGGGGT AGCACAACGT 10B0 

GAGTTTAAGC AATATTTTCC ACAATCAGGT TGGGTTGAAC ATGATGCAAA TGAAATTTGG 114 0 

ACATCTGTGT TAGCTGTAAT GACGGAAGTA ATTAATGAAA ATGATGTTAG AGCTGATCAA 1200 

ATTGCAGGTA TCGGTATTAC AAACCAACGT GAAACAACGG TTGTTTGGGA CAAaCATACT 1260 

GGCCGCCCAA TTTATCACGC AATTGTTTGG CAATCACGTC AAACACAATC AATTTGTTCA 1320 

GAATTAAAAC AACAAGGATA TGAACAAACA TTTAGAGATA AGACAGGATT ACTTTTAGAT 1380 

CCGTATTTTG CAGGTACAAA AGTTAAATGG ATTCTAGACA ATGTTGAAGG TGCACGAGAA 144 0 

20 AAAGCAGAAA ATGGCGATCT ATTATTTGGA ACGATTGATA CTTGGTTAGT ATGGAAATTA 1500 

TCaGGaAAAg C t GCGCATAT TACTGATTAT TCaAATGCGA GTCGTACATT AATGTTTAAT 1560 

ATCCATGATT TAGAATGGGA CGATGAGTTA TTAGAACTAt TACAGTACCT AAAAATATGT 1620 

25 TGCCAGAAGT TAAAGCTTCG AGTGAAGTAT ATGGTAAGAC AATTGATTAC CACTTCTATG 1680 

GTCAAGAAGT ACCAATCGCT GGAGTAGCTG GTGATCAACA AGCAGCATTA TTTGGACAAG 1740 

CTTGCTTCGA ACGTGGTGAC GTGAAAAACA CATATGGAAC TGGTGGCTTC ATGTTAATGA 1800 

ATACAGGTGA CAAAGCGGTT AAATCTGAAA GTGGTTTATT AACAACAATT GCTTATGGTA 1860 

TTGATGGAAA AGTAAATTAT GCGCTTGAAG GTTCCATCTT TGTTTCGGGT TCAGCAATCC 1920 

AATGGTTACG TGATGGATTA AGAATGATTA ATTCAGCACC ACAATCAGAA AGTTATGCGA 1980 

CACGAGTTGA CTCTACTGAG GGTGTTTATG TTGTTCCAGC TTTTGTAGGT TTAGGAACAC 2040 

cataStggga TTCTGAAGCA CGTGGTGCGA TTTTCGGTTT AACACGTGGA ACTGAAAAAG 2100 

AGCACTTTAT CCGTGCAACT TTAGAATCAC TATGTTACCA AACTCGTGAC GTTATGGAAG 2160 

CAATGTCAAA AGACTCTGGT ATTGATGTCC AAAGTTTACG TGTCGATGGT GGTGCAGTTA 2220 

AAAATAACTT TATTATGCAG TTCCAAGCAG ACATTGTTAA TACTTCTGTT GAAAGACCTG 2280 

45 AAATTCAAGA AACTACAGCT TTAGGTGCTG CATTTTTGGC AGGTTTAGCA GTTGGATTCT 2340 

GGGAGAGTAA AGATGATATC GCTAAAAACT GGAAATTAGA AGAAAAATTC GATCCGAAAA 2400 

TGGATGAAGG CGAAAGAGAA AAATTATATA GAGGTTGGAA AAAAGCTGTT GAAGCAACAC 2460 

50 

AAGTTTTTAA AACAGAATAA ACTTGTAGAT TAGACTTTTG TATAAACATT GTGATACAAT 2520 

CAATTTAAGT TAATATTTGA ATCGAGAAGC GAGAGATTTG TTCGAACATG TACAATTGAA 2580 

55 
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GCATTGTCTA CTTTTAAGAG AGAACATATT AAAAAGAATT TAAGAAATGA TGAATATGAT " 210 

TTAGTAATTA TTGGTGGCGG TATTACAGGT GCAGGTATTG CACTAGACGC GAGTGAAAGA 276 

GGAATGAAAG TTGCATTAGT TGAAATGCAA GACTTTGCAC AAGGAACAAG CTCAAGATCT 282 

ACAAAATTAG TCCATGGTGG TTTGCGTTAC TTAAAACAAT TCCAAATTGG AGTAGTTGCC 288 
w GAAACTGGTA AAGAACGTGC GATTGTTTAT GAAAATGGGC CTCATGTTAC GACTCCAGAG 

TGGATGCTTT TACCAATGCA TAAAGGTGGA ACATTTGGTA AATTCT CAAC ATCAATTGGT 300, 

TTAGGAATGT ATGATCGTTT AGCAGGTGTT AAGAAGTCTG AACGTAAAAA AATGTTATCT 306, 

AAAAAAGAAA CTTTAGCTAA AGAAC CATTA GTTAAAAAAG AAGG T CT AAA AGGCGGCGGT 312( 

TACTATGTTG AATATCGTAC TGACGATGCG CGTTTAACTA TTGAAGTTAT GAAGCGTGCT 318 C 

GCTGAAAAAG GCGCAGAAAT TATCAACTAT ACTAAATCTG AACACITCAC TTATGATAAA 324C 

AATCAACAAG TAAATGGTGT TAAAGTTATA GATAAATTAA CTAATGAAAA TTATACAATT 330c 

AAGGCTAAAA AAGTGGTTAA TGCAGCAGGT CCATGGGTTG ATGATGTTAG AAGTGGTGAT 336C 

TATGCACGCA ATAATAAAAA ATTACGTTTA ACTAAAGGTG TACATGTTGT TATTGATCAA 3420 

TCAAAATTCC CATTAGGTCA AGCAGTATAC TTTGATACTG AAAAAGATGG AAGAATGATT 3480 

TTTGCAATTC CACGTGAAGG AAAAG CG TAT GTAGGTACTA CAGATACATT CTATGACAAT 3540 

ATCAAATCTT CACCATTAAC TACACAAGAA GACAGAGACT ATTTAAT CG A TGCGATTAAT 3 600 

TACATGTTCC CTAGTGTTAA TGTTACAGAT GAAGATATTG AATCAACATG GGCAGGAATT 3660 

AGACCATTAA TTTACGAAGA AGGCAAAGAC CCTTCTGAAA TCTCTCGTAA GGATGAAATT 3720 

TGGGAAGGTA AATCAGGTTT ATTAACTATT GCAGGTGGTA AATTAACAGG CTATCGTCAC 3780 

ATGGCTCAAG ACATTGTTGA TTTAGTATCT AAACGCTTGA AAAAAGACTA CGGTTTAACA 3840 

TTTA6TCCAT GTAATACAAA AGGTCTGGCA ATTTCAGGTG GCGATGTAGG TGGTAGCAAG 3 900 

AACTTTGATG CGTTTGTAGA GCAAAAAGTA GATGTAGCTA AAGGATTCGG CATTGATGAA 3 9 .60_ 

GATGTTGCAA GACGTTTAGC ATCTAAATAT GGTTCAAATG TTGATGAATT GTTCAACATT 4 020 

GCGCAAACAT CTCAATACCA TGATAGCAAG TTACCATTAG AAATTTATGT AGAACTTGTT 4080 

45 TATAGTATTC AACAAGAAAT GGTATACAAA CCTAACGATT TCTTAGTTCG TCGTTCTGGT 4140 

AAAATGTATT TCAATATTAA AGATGTATTA GATTATAAAG ATGCTGTCAT CGATATTATG 4200 

GCAGATATGC TTGATTACTC TCCAGCTCAA ATTGAAGCAT ATACTGAAGA AGTTGAGCAA 4260 

GCAATTAAAG AAGCGCAACA TGGaAATAAT CAACCAGCAG TTAAAGAATA AtTAATTTGT 4320 
ACAATCATAA ACTGGTGTCC TOTTTTAAGQ GCATCAGTTT TTTTATACGA GATACATTAG 
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GTTATTAAAG GTOTGAGATG ATGACTGAAA AACAATTTAA ATTAACTGTA CAAGATAATA " 4500 

CGAATATTGA AGTTAAAGTG AATTTTACAG ATGTAGATTC AAAAGGAATT ATTCATATAT 4 560 

5 TTCATGGTAT GGCTGAACAT ATGGAACGTT ACGATAAATT AGCACATGCA CTTTCAAAGC 4 620 

ATGGCTTCGA TGTGATACGT CATAATCATC GAGGACATGG TATTAATATT GATGAATCAA 46 80 

CAAGAGGGCA TTACGATGAT ATGAAACGAG TTATCGGTGA TGCCTTTGAA GTAGCGCAAA 4 74 0 

10 

CAGTGAGAGG CAATGTTGAT AAACCATACA TTATAATCGG ACATTCAATG GGATCCGTTA 4 800 

TAGCTAGATT GTTTGTAGAA ACATATCCGC AATATGTTGA TGGTCTAATT TTAAGTGGTA 4 860 

CTGGTATGTA TTCATTATGG AAAGGTTTAC CAACCGTTAA AGTGTTACAA CTGATTACAA 4920 

is 

AAATTTATGG TGCTGAGAAA CGAGTTGAAT GGGTTAACCA GTTAGTATCA AATAGTTTTA 4 980 

ATAAAAnnAT ACGTCCATTA CGTACACAAA GTGATTGGAT TTCTAGTAAT CCAATTGAAG 5040 

20 TAGATAaCTT TATTAAAGAT CCATATAGTG GaTTTAATGT GTCAAATCAA TTATTATATC 5100 

AAACAGCCTA TTATATGCTA CATACATCAC AATTAAAAAA TATGAAAATG TTAAaTCATG 5160 

CCATGCCTAT ATTATTAGTT TCAGGATATG ACGATCCTTT AGGTGATTAT GGTAAAGGGA 5220 

25 TTTTAAAATT GGCGAATATA TATAGAAACG CTGGCATnAA AAATGTTAAA GTGAATCTTT 52 80 

ATCAT CATAA ACGTCATGAA GTGTTATTTG AAAAnGATCA TGACnAAATT TGGGAAGACT 534 0 

TGTTTAAATG GTTGAATCAA TTTTATAAAA AATAAAGAAA GTGGAATTAA ATATGAATAA 54 00 

30 

AAATAAGCCT TTTATTGTAG TAATTGTGGG GCCAACTGCT TGCAG 544 5 

(2) INFORMATION FOR SEQ ID NO: 74: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 2569 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
* (D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 74: 



TGGCTTGAAC TACGCCAATA AGTCCCCCTA GTACAAGAAT GAATACCATG ATATCGACCG 60 

45 CTTCTATCGT ACCTTCAACC ATGCTACTTG TTATTTGTTC TGGTCCAGCT GGATGTTGCT 120 

TTAATCTTTC ATAAGTATTC GGAATTGATA CCGGCTTATT AATTGCACCT GATTTAAATT 180 

GTTCAATCTT AA T TTTAACC CCCATTTTGT CTAGTTCCTG TTGCGTACCC GGAACCTTTT 24 0 

50 TCACTTGGTT ATGAGGGTTA ACTATCTTTA GTTCTTGGGA TGAAGGTTCG TAAGAAAGTT 300 

TAGAATATGC ACCAG CAGGA ATAACCCATG TTG CTATAAC TGCAACAACC GTTAAAATGA 360 



55 



519 



10 



25 



EP 0 786 519 A2 

TAATTGTATT TTCCACGGTT TCATCTCCTT CGACATTTAA C CTAGCATTT CTACCTTAAA 
GATTTTATAA ATATAAATTA AGAAAGTGCA CCCCGCATCA AAATAGAGGC ATTATTTTCA 
GGGGGTGCAC ATAAATAATA AAAATCATGC ATTTGACATA TAGTAATTGA AAAGCGTTTC 
AATTCAATTA CTTTTTAATC ACAGTACCTA CTTTACCCTC TAAGGCAGCA TCTAATTCAT 
TTAATGATGT TATAAG CACA CTTCCTTTTG GATTGTTTTC AATAAATGAT ATGGCTGCTT 
CAATTTTTGG TAACATACTT CCTTTTGCAA ATTGATTTTC GTCTATATAT CGTTTTAATT 
CATCAACATT TGTTGTTTTC AAAGGCTGTT GGTTTTCAGT GTTAAAATTA ATATATACAT 
75 AATCAATTGC TGTTAAAATA ATCAATTGAT CGCATTGAAT ATTAGCACCC AACAACGCAC 

TTGTTTTATC TTTGTCTATA ACTGCATCAA TACCTTTAAA ACCATCATGT TGCTCTCTAA 
TTACTGGTAT ACCTCCACCA CCAGCAGCAA TAACGAGTGT ATCATTTTTA ATAAGTGTTT 
20 TAATACTCTC TAATTCAATA ATAGAGATGG GTTGTGGTGA AGGAACAACG CGTCTATATC 

CTCTTCCAGC ATCTTCAACA AATATAAATC CTTTTTCTTT TTGAATTTGT TCAGCTTCTT 
CTTTGTTGTA AAATAACCCA ATTGGTTTTG AAGGATTGTT AAATGCCGGA TCATTTTCAT 
CAACTTCAAC TTGTGTCACT AGTGTTACCA CTTGTTTATC CATTCCAATA GAATGCAATT 
CATTTTGTAA GCTTTCTTGT AATTGATAGC CGATGTAAGC TTGACTCATT GCGCCACATT 
CAGCAAATGG AAATGCCGGA CCTTGGTTAT GTTCTGCAGC ATAGTTAAGT CCCAAATTAA 
TGCTTCCAAC CTGTGGTCCA TTACCATGAC TAATAACAAT CTCATGTCCT TTTGTnATTA 
AyCCTACTAA TGATTt CGCA GTATTTTTAA CAAGCTCGAG TtGgTyCTTG aGGTGATTTn 1500 
3s CCTAAAGCAT TACCACCTAA TGCTACTACT ATTTTCGCGA TCATATTCAC TTCCTTATAT 1560 

CATTTAAAAT TCACCCAATG TAGCAACCAT GaCTGCTTTG ATTGTATGCA TTCTGTTCTC 162 0 

AGCTTCTTGG AATACAACTG AAGCTTTACT TTCGAATACT TCATCTGTAA CTTCCATTTC 1680 
40 TCGAATACCA TATTTTTCAA AAATTTGTTG ACCTATTTTC GTATCAGCAT TATGGAAAGA 174 0 

TGGTAAGCAA TGCTCAAAAA TAACATTTGG ATTACCAGTT TTATCCATTA TTTCTTTATT 1800 
TACTTGATAT GGTTTCAATA ATTCAAGTCG TTCTTTCCAT ACTTCATCAG GTTCACCCAT 1860 
TGATACCCAA ACATCAGTGT AAATTACATC CGAACCTTTT ACaCCTTGGT CaATATCATC 1920 
TGTGATTAAT ATGTTGCCaC CATTTTCaGC GG CAATATTT TTACAGCGAT TTAATAATTC 19 80 

ATCTGTTGGA TTTAATTCTT TTGGACAAAC TAAATGGAAG TTCATACCCA TAATGGCAGC 204 0 

ACCTTGCATT AATGCATTTG CAACGTTATT ACGACCATCT CCAACATATG TAAAGTTAAT 2100 
ATCTGCATAA TCTTTTTTTA AGACTTCTTT TGCTGTTAAG AAATCAGCAA GAACTTGAGT 2160 
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TTCTACTGTT CTTTGTGAAA AACCACGGTA TTCAATGCCA TCATACATTC CACCAAGCAC 2280 

ACGTG CAGT A TCTTTAGTTG TTTCTTTTTT ACCCATTTGT GATCCAGTTG GGCCTAAATA 234 0 

5 AGTTACATTT GCACCTTGAT CATGCGCTGC AACTTCAAAT GCACATCGCG TTCTTGTAGA 2400 

ATCTTTTTCA AATAACAGTG CAATATTTTT ATTTTTTAAC ATAGGCTTTT CAGTGCCAAT 24 60 

ATATTTAGCA CGTTTTAAAT CCTCGGAGAG TGTTAATAAG GTTCTACCTC TTGTCGTGAA 252 0 

10 

AAGTCTAATA AAGTTAAAAA ACTTCTGTTT CGTAnATTTT TCATTAAnA 256 9 

(2) INFORMATION FOR SEQ ID NO: 75: 

(i) SEQUENCE CHARACTERISTICS: 
15 (A) LENGTH: 1273 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 75: 



25 



30 



35 



40 



CCTGGAACCA 


TCCaATCGtG 


CaAATCCTGa 


AAGaGAATAC 


GCAACAACAA 


TTAAATGTAT 


60 


TGGAACACTA 


TATTCCAAAT 


GACCATCCAG 


CACTCGTTGA 


ATTAAAAATA 


TGGGAACGTT 


120 


GGTTACATAA 


ACAAGGTTAC 


AAAGACATCC 


ATTTAGATAT 


TACTGCGCAC 


CACCTAGATC 


180 


CTATTACACA 


GGTTTATTTA 


TTCAATGTCA 


TTTTGCTGAA 


AATGAATCTC 


GAGTTTTAAC 


240 


AGGTGGTTAT 


TACAAAGGAA 


GCATCGAAGG 


GTTTGGATTA 


GGATTAACAC 


TTTAAGTAAG 


300 


GGAGTATG C A 


CAATGTTAAG 


AATCGCCATA 


GCCAAAGGAC 


GTCTAATGGA 


TAGTTTAATT 


360 


AACTATTTAG 


ATGTAATTGA 


ATATACGACA 


TTATCAGAAA 


CATTAAAAAA 


TAGAGAACGC 


420 


CAATTATTAT 


TAAGTGTAGA 


TAATATTGAA 


TGCATTTTAG 


TAAAAGGAAG 


TGACGTGCCA 


480 


ATCTATGTGG 


AACAAGGAAT 


GGCAGACATA 


GGCATTGTTG 


GTAGCGACAT 


ATTAGATGAG 


540 


CGCCAATATA 


ATGTTAATAA 


TITGTTGAAT 


ATGCCTTTTG 


GAGCATGTCA 


TTTTGCGGTT 


600 


GCAG CGAAAC 


CTGAAACGAC 


CAATTATCGT 


AAAATCGCAA 


CGAGTTATGT 


TCATACTGCT 


660 


GAAACATATT 


TTAAATCAAA 


AGGTATTGAT 


GTCGAATTGA 


TTAAATTGAA 


TGGCTCTGTT 


720 


GAATTGGCCT 


GTGTTGTAGA 


TATGGTAGAC 


GGAATTGTCG 


ACATCGTTCA 


AACAGGTACT 


780 


ACGCTAAAAG 


CGAACGGACT 


GGTTGAAAAG 


CAACATATTA 


GTGATATCAA 


TGCAAGATTA 


840 


ATAACTAATA 


AAGCAGCTTA 


TTTTAAAAAA 


TCACAATTAA 


TAGAGCAATT 


TATTCG CTCT 


900 


TTGGAGGTGT 


CTATTGCCAA 


TGCTTAATGC 


ACAACAATTT 


TTAAATCAAT 


TTTCATTAGA 


960 


AGCACCATTA 


GATGAGTCAT 


TGTATCCaAT 


TATTCGCGAT 


ATTTGTCAGG 


AAGTTAAAGT 


1020 
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TTTAGaAATT AGTCATGAmC AAATTAAAGC AGCATTTGAC ACATTAGATG AAAAAACAAA 
ACAAGCATTA CAACAAAGTT ATGAAAGAAT T AnAG CAT AT CAaGAAaGTA TtaAACAGaC 
GaATCAACAG TTAGAAGaAT CAGTGGaGTG tTrTGaAATA TACCATCCmC taGaAAGTGT 
CGGTATTTAT GTG 

(2) INFORMATION FOR SEQ ID NO: 76: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1308 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 76: 
20 GTTGATAAAT TAAAAATGTT TTTATCAGAT ATTCAAAGTT ACCAACAATA TAGTAAAGAT 

CATCCGGTGT ATCAGTTAAT TGATAAATTT TATAATGATC ATTATGTTAT TCAATACTTT 
AGTGGACTTA TTGGTGGACG TGGACGACGT GCAAATCTTT ATGGTTTATT TAATAAAGCT 
ATCGAGTTTG AGAATTCAAG TTTTAGAGGT TTATATCAAT TTATTCGTTT TATCGATGAA 
TTGATTGAAA GAGGCAAAGA TTTTGGTGAG GAAAATGTAG TTGGTCCAAA CGATAATGTC 
GTTAGAATGA TGACAATTCA TAGTAGTAAA GGTCTAGAGT TTCCATTTGT CATTTATTCT 
GGATTGTCAA AAGATTTTAA TAAACGTGAT TTGAAACAAC CAGTTATTTT AAATCAGCAA 
TTTGGTCTCG GAATGGATTA TTTTGATGTG GATAAAGAAA TGGCATTTCC ATCTTTAGCT 
3$ TCGGTTGCAT ATAGAGCTGT TGCCGArAAA GAACTTGTGT CAGAAGAAAT GCGATTAGTC 

TATGTAGCAT TAACAAGAGC GAAAGAACAA CTTTATTTAA TTGGTAGAGT GAAAAATGAT 
AAATCATTAC TAGAACTAGA GCAATTGTCT ATTTCTGGTG AGCACATTGC TGTCAATGAA 
40 CGATTAACTT CACCAAATCC G " C »TCri^ATTTAT;AGTA TTTTATCTAA ACATCAATCT 

GCGTCAATTC CAGATGATTT AAAATTTGAA AAAGATATAG CACAAATTGA AGATAGTAGT 
CGTCCGAATG TAAATATTTC AATTGTGTAC TTTGAAGATG TGTCTACAGA AACCATTTTA 
GATAATGATG AATATCGTTC GGTTAATCAA TTAGAAACTA TGCAAAATGG TAATGAAGAT 
GTTAAAGCAC AAATTAAACA CCAACTTGAT TATCGATATC CATATGTAAA TGATACTAAA 
AAGCCCTCAA AACAATCTGT TTCTGAATTG AAAAGACAAT ATGAAACAGA AGAAAGTGGC 
ACAAGTTACG AACGAGTAAG GCAATATCGT ATCGGTTTTT CAACGTATGA ACGACCTAAA 
TTTCTAAGTG AACAAGGTAA ACGAAAAGCG AATGAAATTG GTACGTTAAT GCATACAGTG 
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GATGGATTAA TCGATAAACA TATTATCGAA GCAGATGCGA AAAAAGATAT CCGTATGGAT 
GAAATAATGA CATTTATCAA TAGTGATTAT ATT CG AT ATT GCTGAAGC 
5 (2) INFORMATION FOR SEQ ID NO: 77: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14 31 base pairs 

(B) TYPE: nucleic acid 

TO (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 77: 





GATGCCATTn 


ATnnGTATGC 


AAGAAGTTGT 


TCCGGGTTCA 


GGTGGATTaC 


CAGTTGGTAC 


60 




TGGTGGTAAG 


ACGTTACTAA 


TGCTTTCAGG 


CGGTATAGAC 


TCACCAGTTG 


CTGGGATGGA 


120 


20 


AGTGATGAGA 


CGTGGCGTAA 


CAATTGAAGC 


GATTCATTTC 


CATAGTCCAC 


CATTTACAAG 


180 




TGATCAAGCA 


AAAGAAAAAG 


TTATTGAATT 


GACACGTATT 


TTAGCTGAAC 


GTGTTGGACC 


240 




AATTAAATTG 


CATATTGTAC 


CATTTACAGA 


ATTGCAAAAA 


CAGGTAAATA 


AAGTTGTACA 


300 


25 


TCCAAGATAT 


ACAATGACTT 


CAACGAGACG 


TATGATGATG 


CGTGTTGCTG 


ATAAATTAGT 


360 




ACATCAAATA 


GGGGCTTTAG 


CTATTGTAAA 


TGGTGAAAAC 


CTAGGGCAGG 


TAGCCAGTCA 


420 


30 


AACACTTCAT 


AGCATGTATG 


CAATTAATAA 


TGTAACTTCT 


ACTCCTGTAT 


TACGTCCTTT 


480 


ATTAACTTAC 


GATAAAGAAG 


AAATTATTAT 


TAAATCGAAA 


GAAATTGGTA 


CATTTGAAAC 


540 




ATCTATTCAA 


CCATTTGAAG 


ATTGTTGTAC 


AATTTTCACC 


CCTAAAAATC 


CAGTAACCGA 


600 


35 


ACCAAACTTT 


GATAAGGTAG 


TCCAATATGA 


AAGTGTCTTT 


GATTTTGAAG 


AGATGATTAA 


660 




TCGTGCTGTT 


GAAAATATTG 


AAACACTTGA 


AATAACTAGT 


GATTATAAAA 


CTATTAAAGA 


720 




ACAGCAAACA 


AACCAATTAA 


TAAACGACTT 


TTTATAAATA 


AAATCCTAGA 


GTAAATTTAA 


780 


40 


ACATAAGGGG 


ATGTTAAACT 


ATGGATTTGA 


ACTTAACGAT 


GATTATAATC 


ATAATTTTAT 


840 




TTGGTTTTAT 


CGCGGCGTTT 


ATAGATTCGG 


TTGTAGGGGG 


TGGCGGTTTA 


ATTTCTACGC 


900 




CAGCATTATT 


AGCAATCGGT 


CTACCACCAT 


CTGTGGCTTT 


AGGTACAAAT 


AAATTGGCAA 


960 


45 


GTTCGTTTGG 


TTCTTTAACT 


AGTACGATAA 


AGTTTATAAG 


GTCCGGTAAA 


GTGGACTTAT 


1020 




ATGTTGTTGC 


CAAATTATTT 


GGTTTTGTAT 


TTTTGGCATC 


TGCATGTGGC 


GCATATATTG 


1080 


SO 


CAACGATGGT 


TCCGTCACAA 


ATATTGAAAC 


CTTTAATCAT 


CATTGCACTT 


TCGTCGGTGT 


1140 


TTATATTCAC 


ATTACTTAAA 


AAAGATTGGG 


GCAATACACG 


CACGTTTACT 


CAATTTACAT 


1200 




TTAAGAAAGC 


CATAATATTT 


GCAGCACTTT 


TTATATTAAT 


CGGCTTTTAT 


GATGGATTTG 


1260 
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w 



40 



45 



TAAGTGCAGC AGGAAATGCT AAAGTTTTGA ACTTTGCTTC TAATATAGGT GCGCTTGTAT 
TATTTATGGT ATTAGGACAA GTAGATTATG TAATAGGTTT AATTATGGCT A 
(2) INFORMATION FOR SEQ ID NO: 78: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4403 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



1380 
1431 



15 < xi > SEQUENCE DESCRIPTION: SEQ ID NO: 78: 

AATATTATTT TAAATTCAAT ATTTATTGGT GCATTTATTT TAAACTTATT ATTCGCCTTT 
ACCATTATTT TCATGGAAAG ACGTTCTGCC AATTCTATCT GGGCTTGGTT ACTAGTCTTA 

20 GTTTTCTTGC CTTTATTCGG CTTCATTtta TarTrarrnT 

GACCAAATTT TCAAAATTGA TAAGGAAGAT AAAAAAGGAT TAGAGTTAAT CGTTGATGAG 
CAATTAGCTG CTTTAAAAAA TGAAAACTTT TCAAATTCCA ATTATCAAAT TGTAAAATTT 
AAAGAAATGA TTCAAATGTT GTTATATAAT AACGCAGCAT TTTTAACAAC AGACAACGAT 
TTArrrrtAT ACACAGACGG CCAAGAAAAA TTTGATGACC TAATACAAGA CATCCGTAAT 
50 GCTACTGATT ATATTCATTT TCAGTACTAT ATTATTCAAA ATGATGAATT AGGTCGTACC 

ATTTTAAATG AACTTGGTAA AAAAGCGGAA CAAGGTGTAG AAGTTAAAAT TCTTTATGAT 
GACATGGGTT CTCGTGGACT GCGTAAAAAA GGCTTACGCC CGTTTCGCAA TAAAGGTGGA 
35 CATGCTGAAG CATTTTTCCC ATCAAAATTA CCTTTAATTA ACTTGCGTAT GAACAATCGA 

AACCATCGAA AAATTGTTGT AATAGATGGG CAAATTGGAT ATGTTGGTGG TTTTAATGTT 
GGTGATGAGT ACTTAGGTAA ATCAAAAAAA TTCGGCTATT GGCGAGATAC GCATTTACGA 
ATTGTCGGGG ATGCAGTGAA TGCATTGCAA TTACGATTTA TTCTAGATTG GAATTCACAA 
GCCACACGTG ACCACATCTC CTATGATGAT CGTTATTTCC CAGATGTAAA TTCTGGTGGA 
ACAATTGGCG TTCAAATAGC TTCTAGTGGT CCTGACGAAG AATGGGAACA GATTAAATAC 
GGCTATTTGA AAATGATTTC ATCTGCTAAA AAATCGATTT ATATTCAATC TCCCTATTTC 
ATACCTGATC AAGCCTTTTT AGATTCTATT AAAATTGCGG CATTAGGTGG TGTTGATGTC 
AATATCATGA TTCCTAATAA ACCTGACCAT CCGTTTGTTT TTTGGGCTAC TTTAAAAAAT 
GCAGCATCCT TATTAGATGC CGGTGTTAAA GTATTTCACT ACGACAATGG CTTTTTACAC 
TCAAAAACAC TTGTTATAGA TGATGAAATT GCAAGTGTGG GAACAGCTAA TATGGACCAT 
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AAATTAAAAC AAGCTTTTAT AGATGATTTA GCAGTATCTT CTGAATTAAC AAAAGCACGT 1380 

TATGCTAAGC GAAGTCTTTG GATTAAATTT AAAGAAGGTA TTTCACAATT ATTGTCACCT 144 0 

ATCTTATAAA ATAGAAATAT GAGGAGTGTA aCTTTAATGC AACAATCAGA CGTCATTAGT 1500 

GCTGCCAAAA AATATATGGA AT CTATTCAT CAAAATGATT ATACAGGCCA TGATATTGCG 1560 

CATGTATATC GTGTCACTGC TTT AG CT AAA TCAATCGCTG AAAATGAAGG TGTTAATGAT 1620 

ACTTTAGTCA TTGAACTCGC ATGTTTGCTT CATGATACCG TTGACGAAAA AGTTGTAGAT 168 0 

GCTAACAAAC AATATGTTGA ATTGAAGTCA TTTTTATCTT CTTTATCACT ATCAACCGAA 1740 

GATCAAGAGC ACATTTTATT TATTATTAAT AATATGAGCT ATCGCAATGG CAAAAATGAT 1800 

CATGTCACTT TATCTTTAGA AGGTCAAATT GTCAGGGATG CAGATCGTCT TGATGCTATA 1860 

GGCGCTATAG GTGTTGCACG AACATTTCAA TTTGCAGGAC ACTTTGGTGA ACCTATGTGG 1920 

20 ACAGAACATA TGTCACTAGA TAAGATTAAT GATGATTTAG TTGAACAGTT GCCACCATCT 1980 

GCAATTAAAC ATTTCTTTGA AAAATTACTT AAGTTAGAAT CTTTAATGCA TACAGATACG 2040 

GCGAAGATGA TTGCTAAAGA ACGTCACGAC TTTATGATGA TGTACTTGAA ACAGTTTTTT 2100 

ACGGAATGGA ATTGTCACGA CTAGACATTG AAGTTGTAGT ATGATGATGC GATGTAATGG 2160 

CGTGTTGTTG TGGAAGCTTG GTGTCATGCC ATGTTACTTT GATGTGTTGT TGTGGGAGCT 2220 

TGGTGACATG TCATGCTACT TTGATGTGCT GGTACCACGA TGCGTCTTGA TGTAGTGCTA 2280 

TGATGTGGCA TTGCGGTGTT ATGGTGTTAT AGACAGGTTT GGCGTTGATG CCATGTTACT 2340 

TTGATGTGCT GGTACCACGA TGCGACTTGA TGTAGTGCTA TGATGTGGCA TTGCGGTGTT 24 00 

ATGGTGTTAT AGACCGGTTT GATGTTGATG CCATGTTACT TTGATGTGCT GGTGCTACGA 24 60 

TGCGACTTGA TGTAGTGCTA TGATGTGGCG TTGCGCTGTT ATGGTGTTAT AGCCAGGTTT 2520 

GGTGTTGATG TCATGCCGTT ACGATTCTAT GATATGTTGT TGGGACGTTG CAATGTGTAT 2580 

40 TATGCCGTTG TGACGTTATT ATTTCACACT GTTACATGTA TAAGTGAATT GCTGTGGAAA 2640 

TTTGCGACAT ATACTGCTAC ACTGATGAAT CATTGTGTCA AGATGACATT GCGATGAAGA 2700 

ATGACAACTC TGTTATTAAC CACTTTTTAC ATACTGAAAA CTCGTTAATA TTATTTCAAA 2760 

TAAAAACAGC AGTAGGATGA CTTTCACATT TGAAATCATC TTACTGCTGT TTCTATTTAT 2820 

CACATATTGT ATAATGTGAC ACTAAGTTTC GCTATTGAAG CGAAAAATAA TGTGCGCCCT 2880 

ATAAAGTTAA AATTATCTTC AACTTTTAGG GTGCACATTA TTTGGACTTG CTAAGGTTAT 294 0 

TTCTTTTTCT TTTTAGACAC AACTTGTGTG TTTTTGCCTT TTTTATTGct GCCGCCGTTG 3000 

TGCTCTCTTT CATACGCTTC AATGAAAGGT TGTACTTCTT TTTTAGCGAC TTTTTCATAA 3060 
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CCAAGTGCTG ATGCTGAGCT TAATGAAATC CAGATAATCA TAATTGGTGA AATGACCATC 
ATCATGTAAC CCATTTGACG TTGTTCGTCT GGCATCGTTT TACTTGATAC ATATGCTTGG 
ATAAAGTATA AAACACCGGC AATAATTGTA ATCCAAATAT CAGGACGTCC TAAATCGAAC 
CATAAGAAGT GTGGATATTT AAACAAACCA TCTACAAGTT GGTCTTTAAG TACAAAGTAT 



3180 
3240 
3300 
3360 

AATCCCATGA TGATTGGTAA TTGGATTAGC ATTGGTAAAC AACCCAACAT ACTCTTAATC 

3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 

30 — . x v_x x irtfthu,! iUCAATCATT 4080 



W nMUuLAALA I ACTCTTAATC 3420 

GGGTTCATGT CATACTTTTT ATATACTTGC ATTAATTCTT GGTTTGCAGC CATTTTTTCT 
TCTTGTGTAC GCGnCaCGTT cACTTTTTCT TGAATTTTTT CAACTTCTGG CTTTGCAACT 
TTCATTTTTT GACGCATCAT ATGACTATTT TTATAGTTTG ACAACATGAA TGGTAATAAA 
ATAATACGAA TTACCAATAC AAGGATAATA ATAGCTAAAC CATAATTGTC GTTTAATAAG 
TTATTTCC CA ACCAATCCAA TACATTTTTC ATTGGATCTA CGAATGTATT GTAGAAAAAy 
cwCtACGTTT TTCAGGTTTA GAATAGTCAC AACCAGCCAA AAAGACCATA ATACCTAAAA 
ATAATGGTAG TAACGCTTTT TTCTTCATTT TTCCACCTCT AT CATTATAT TCACATAGGA 
TTTATTCTAT CACATTAATG AGTACGTATG AAACAATAAG TGGAAAAATT TAACTAATTA 
TTAAAAAAAT CTTTGAATCG ATTAACAGTC TTTTCAATAT TTTCACTTTT AGAAATGGCT 
GAAATGACTG AAATTCCATT GGCACCTGCT TCTACAATCG GCGCCACATT ATTAGTATTG 
ATACCGCCAA TAG CTACAAT CGGTAGTTGC GGATTCATTT CTTTAAACGT TGCAATCATT 
TCTGGACCTA CTGGTATATG CGCGTCATGC TTCGACGGCG TAGGATAGAT TGGTCCAACA 
CCTATATAAT CmACATGAGT TAAATCAGAT TTTGCATACT CATCTAAATC ACTAATACTA 
35 AGTCCAATAA TTTTATCAGT GAAATATTGT GCTATCTCTT TGACTTTCGC ATCATCTTGA 

CCGACATGTA TACCATCCGC GTTAATTTCT TTTGCCAAGG ATACATCATC ATTAACGATA 
AAAGGCACAT CATATTGATG ACAGAGATGC TGTAATTCTT TAGCTAATAC AAGTTTATCG 
40 TTTCCTTTTA AAGCTGATTC ACC 

(2) INFORMATION FOR SEQ ID NO: 79: 

(i) SEQUENCE CHARACTERISTICS: 
4S <A) LENGTH: 1808 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 79: 
TGGAnCCAAT ATTAGAAATG ATTAAAACAT TAACAGGTAT TAATAGTCCT TCAGGAGnCA 



4140 
4200 
4260 
4320 
4380 
44 03 
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TAACAAATAA AGGTGCGTTA TTAATAACAG TGCCAGGCAA AAATGATGAA GTACAACGCT 18 0 

GTATTACTGC TCATGTTGAT ACTTTAGGTG CaATGGTTAA AGAAATTAAA GAAGATGGTC 24 0 

GCTTaGCAAT AGAATTAATT GGAGGATTCA CGTATAACGC GATTGAGGGT GAATATTGCC 300 

AAATTAAAAC TGATGCTGGT CAAATATATA CAGGAACAAT TTGTCTGCAT GAAACAAGTG 36 0 

TTCATGTATA TAGAAATAAT CATGAAATAC CTAGAGATCA AAAGCATATG GAAATAAGAA 4 20 

TTGATGAAGT AACTACATCA GAAGAAGATA CAAAGAGTTT AGGTATTTCA GTAGGTGATT 480 

TTGTTAGCTT TGATCCACGT ACAGTTATCA CGTCATCAGG TTTTATTAAA TCTCGTCATT 54 0 

/5 TAGATGATAA AGCTAGCGTA CGgTtGATAC TACAATTACT AAAGAAATTA AAAGAAGAGC 600 

AAATAATATT ACCACATACA ACGCAATTTT ATATTTCTAA TAACGAAGAA ATAGGTTACG 660 

GTGCAAATGC ATCAATTGAT TCGAAAATCA AAGAATATAT TGCATTAGAT ATGGGCGCGT 720 

TGGGAGACGG TCAAGCATCG GATGAATATA CAGTTTCTAT TTGTGCCAAA GATGCTTCAG 780 

GTCCATATCA TAAGCAATTG AAATCGCACC TAGTTAATCT TTGCAAAATA AATAACATTC 840 

CATATAAAGT AGACATATAT CCATATTATG GTTCAGATGC TTCAGCAGCT TTACATGCTG 900 

GTGCGGATAT CAGACATGGT TTATTTGGCG CTGGCATTGA ATCATCTCAT GCAATGGAAC 960 

GAACACATAT TGATTCTATT AAAGCGACAG AGAAATTACT ATATGCATAT TGCTTATCAC 1020 

CAATTGAGTA AACAATTAGT GTTGACAAAT GTGaACGACC TATGTAATAT AATGAACTAT 1080 

AAAAATAATT AGAATTTTCT AAAGAAATAG TAGCAGATAT GAAACGTAGC AAATAGAAAG 114 0 

CTAATGGGTG ATGGGAATTA GCACGCCATA TCTTGTGAAT TGGACTTTGG AAAACAATTG 1200 

AATGAGTTTT GAAAGTGAAC ATGAATTATG TTAACTAAGG TGGCACCACG GTAACGCGTC 1260 

CTTACAGGTA TATGCGTTAT GTGGTGTCTT TTTATTTAGA CAAAATGTAG TAGTTAATTA 1320 

AAGCTAGCAA CAGAAAGTTA GTGGATGATG TGAACTAACA CCGAGATTAA TGAAATTGGG 1380 

40 TTTTGTCTGC AACAGAAAAA TTATATATAG TAAAGAGTGA ACTATGAATA TTTCGAATAT 1440 

TCGGTTAATT TAGGTGGTAC CACGCGTCAc nTCCTTTATA TTGATAAGGA TGCTGGCGCT 1500 

TTTTTGAAAG GAGCGTATAG AATGGATATA TTTTATAAAA AAATAAAAGC AAATGTAACG 1560 

CCCGAAGTTT TAGCACAACT TCATTCCAAG AAGaTCATTT TGGAAAGTAC AAATCAACAA 1620 

CAAACTAAAG GTCGCTATTC AGTTGTTATT TTTGATATTT ATGGCACTTT AACTTTAGAT 16 80 

AATGATGTAT TATCAGTAAG TACTTTAAAA GAATCGTATC AAATCACTGA AAGACCGTAC 174 0 

CATTATTTAA CGACTAAnAT AAATGAAGAC TACCATAATA TTCCAAGATG AGGCAACTTA 1800 

AGTCATTA 1808 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1320 base pairs 

(B) TYPE: nucleic acid 

5 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



70 


(xi) 


SEQUENCE DESCRIPTION: 


SEQ ID NO: 


80: 








TGGTCGTCAA 


TTTCTTGATT ATATCTATAA 


TCCTCATTTT 


CAATATTAGA 


GTCTGTAGAA 


a o 
o U 




TCATCGATAT 


TATTATCATT CGCATGACTA 


GAAGCAGAAT 


CATTATTTTT 


ATCATTGCTT 


TOO 


75 


TCTTCTTTTT 


TGAAGTCTTT ATTTATCAAG 


TAAATTTCTT 


CATCAAAATC 


AGCTTGTTGA 


ItJO 




GATGTATCAT 


CTTTATTTTG ATTAGAAAAA 


TGTGTAGCCT 


TTGATCTTTT 


TCTTTGCCGT 


240 




CTTTTCTTAG 


ATGTATTCCT CGTAAATAAT 


TCTAATTCAT 


CTTTATCTTC 


ATTTGATTCT 


300 


20 


TGTTGATCGT 


TCTTCGTTTT ATCATCCATC 


AATACTCACA 


CCCTTTAATA 


AGATGGTAAA 


360 




TGGGCACGGA 


ATCTTTCAAT AAATTTCTCT 


CCACGCTCTT 


CAAAAGTACT 


ATATTGATCC 


420 


25 


CAACTCGCAC 


AAGCAGGTGA CAATAATACA 


ACATCATTTG 


GTTCTATAAT ATCTTGTACT 


480 


TTATCAACAG 


CGTCTTCGAC ATTGTTCGCT 


TCAATGACCG 


ATTTCCCTTG 


ACTATTACCT 


OH U 




AGTTTAGCAA 


ACTTAGCTTT CGTTTGTCCG 


AATACAACCA 


TCGCGCGAAC 


ATTTTCCATA 


DvU 


30 


TAAGGAATGA 


GTTCGTCAAA TTCATTCCCT 


CGATCCAAAC 


CACCACATAA 


CCAAATGATT 


£t n 




GGTTGATTAA 


ATGAATTTAA GGCAAACTGT 


GTTGCTAGCG 


TGTTTGTTGC 


TTTGGAATCA 


ion 




TTATAATATT 


TATTAGTTCT ATTAGTACCA 


ACATATTGCA 


ATCTATGCTC 


TATTCCTGAA 


78 0 


35 


AATGTAGTTA 


AACTATCAAT AATTGC t TTA 


ATAGGTACAC 


CAGCanAATA 


CAAGCAAGCA 


84 0 




CAGCTGCTAA 


TATATTTcTA AATTATGTTC 


ACCAGGCAAT 


ACTAGAtCTT 


CAGTGTTAAT 


900 




AATaCfiAACA 


CCTTTATaAA CGATAAAACC 


ATCTTtAATA 


TAAaTACCAT 


CArCTtCTTG 


960 


40 


TTGAGTTGAG AAATACAATG TCTTAGCTTT 


TAATTCTTCC 


GACTCTATCA 


CTTGTCTTTG 


1020 




ATGATAATTA 


CAAATCAAAT AATCCTCTTC 


CGTTTGATTT 


TTATATATTT 


GCTTTTTAGC 


1080 


45 


ATTTTGATAG 


TTTTCTAAAT TTTCATGGTA 


ATCTAGATGC 


GCCGAATAAA 


TGTTAGTAAT 


1140 


TATAGCAATG 


TGTGGTTTAT ACTTTTCGAT 


TCCAAGTAAC 


TGGAATGACG ACAACTCTGT 


1200 




AACTAAATAA 


TCTGTAGGCT TTACTTCTTG 


TGCTACTTTA 


GATGCAACAT AACCAATATT 


1260 


SO 


GCCGGATAAT 


CTTCCAGTTA AGCGACTTTT 


TTTAAACATA 


TCTCCAATTA 


GAGAAGTAAC 


1320 


(2) INFORMATION FOR SEQ ID NO: 81 











(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4280 base pairs 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 81: 

TTTACACCAA TCAAAAAATC GAACTGATAT AAATAAGTAC AAAG CTT AT C TATCAATCCG 60 

ATTTAGTTAT AAAACAAAAA AAGCCACAGT AATGTGGCTT TTTGTTATAT TCAGTATCAA 120 

AATGGTATCA ATAGCCATTT TCGGAAGTCA AGAATGGCTT AACAACGCGG TTTAAAGCTA 180 

TCCAATACTA CCTTCCATTT CGAACTTGAT TAAACGGTTC ATTTCGACCG CGTATTC CAT 24 0 

'5 TGGAAGTTCT TTTGTAAATG GTTCGATGAA TCCCATAACA ATCATTTCTG TCGCTTCTTC 300 

TTCAGAAATA CCACGACTCA TTAGATAGAA TAATTGTTCT TCAGAAACTT TTGAAACCTT 3 60 

GGCTTCATGT TCTAATGATA TTTGATCGTT GAATACTTCG TTATATGGAA TTGTATCTGA 420 

TGTTGATTCG TTATCTAAGA TTAATG TAT C ACATTCAATA TTTGAACGAG CACCTTTTGC 4 80 

TTTACGTCCA AAATGAACAA TACCGCGATA AATAACTTTA CCACCATTTT TAGAAATAGA 54a 

TTTAGAAACA ATTGTAGAAG ATGTATTAGG TGCTTTATGA ATCATTTTAG CACCGGCATC 600 

TTGAACTTGT CCTTTACCAG CAAATGCAAT AGATAATGTA CTACCTTTTG CACCTTCACC 660 

TAAAAGAACA CAGTTTGGAT ATTTCATCGT TAACTTAGAA CCTAAGTTAC CATCTACCCA 72 0 

TTCCATATTT CCGTTTTCAT AAACAAAAGT ACGTTTTGTA ACTAAATTGT ATACATTGTT 78 0 

CGCCCAGTTT TGAATCGTAG TATAACGAAC GTGCGCATCT TTATGCACAA TGATTTCCAC 84 0 

AACAGCAGAG TGTAAAGAAC TAGTTGTATA AACTGGTGCA GTACAACCTT CTACGTAATG 900 

3s TACAGAAGCA CCTTCATCAG CAATGATTAA TGTACGTTCA AATTGACCCA TGTTCTCAGA 960 

GTTAATACGG AAATAAGCTT GTAGTGGCGT ATCTAGTTTG ATATTTTTAG GTACATAAAT 1020 

GAAOTAACCA CCTGACCATA CTGCTGAGTT TAACGCCGCA AATTTGTTAT CTGCTGCAGG 1080 

TACTACAGAA G CAAAGTATT TTTTGAATAA TTCTTCATTT TCTTGTAAAG CACTATCTGT 114 0 

ATCTTTAAAG ATAATACCTT TTTCTTCAAG TTCTTTTTCC ATATTATGGT AAACAACTTC 1200 

AGATTCATAT TGAGCAGAAA CACCAGCTAA ATATTTTTGT TCAGCTTCAG GAATTCCTAA 1260 

TTTATCGAAA GTTCTTTTAA TTTCTTCTGG CACTTCATCC CATGAACGTT CAGCTTGTTC 1320 

TGAAGGCTTT ACATAGTAAG TAATGTCATC GAAATTCAAT TCTGATAAGT CGCCACCCCA 1380 

TTGAGGCATT GGCATTTTAT AAAACAATTT TAATGATTTA AGACGGAAAT CTAACATCCA 144 0 

TTCCGGCTCA TTTTTCATGT TAGAAATTTC TCTAACGATA TTCTCAGTTA AACCACGTTC 1500 

TGATCTGAAA ATGGACACAT CATCGTCGTG GAATCCATAT TTATAATCCC CAACATCAGG 1560 
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TTTAATTCAT GATGTAAACC ATATTATAAC AATGACATGA CATCTTATAA AAATTTTTAT 1680 

ACTTTTATAT GTCTAATATC AAAATTATCT ATGATTAACA GCATTCTATT CTTCTTCAGT 174 0 

CGTACCTTCT GCTTTACCTT CTTTAGCAAC AGTACCTTTT TCCAATGCTT TCCAAGCTAA 1800 

TGTGGCACAT TTAATACGAG CTGGGAATTG AGATACACCT TGCAATGCTT CAATATCTCC I860 

CATTTCTTCT GTAATCACAT AGTCTTCACC AAGCATCATT TTCGTAAATT CTTGGCTCAT 1920 

TTGCATTGCT TCTCCAAGTG AATGACCTTT AACAGCTTGT GTCATCATCG ATGCACTTGC 1980 

CATTGAAATC GAACAACCTT CACCTTCAAA CTTAGCATCT TTTATAATGC CGTCTTCTAT 204 0 

ATCAAATGTT AGTCGTATAC GGTCACCGCA TGTCGGGTTA TTCATATCTA CTGTCATAGA 2100 

CCCGTTATCT AATACACCTT TATTTCTAGG ATTTTTATAA TGATCCATAA TGACAGATCT 2160 

ATATAATTGA TCTAGATTAT TAAAATTCAT AAGAGAAAAA CTC CTTCGTT TGTTTCAAGG 2220 

PIVTTTZITTZL PTY^ZlTT'Ii ft r*n Ti'VlTTTTrr: Tr?T M T , r^T'T\T'nT» ata a a t\ a r"T»r» r'/TiT* i^r>rv-< <-,^r.y* 

TTGAAGACAC ATTTAACCAT TTCATTAACG GTTGCGCACA ATGATGCCCA GCTCTAACCG 2340 

CTACACCTTC TGTATCTACG GCTGTAGCAA CATCGTGTGG ATGTACATCT TGTAAATTAA 24 00 

25 ACGTTATTAC ACCTGCACGA CGATCCTTTG GCGGGCCATA AATTTCAATT CCTTCAATTG 24 60 

CAGACATTTG CTCATAAGCA TAT AT CGTT A ATTCTTGTTC ATATTTATGA ATTG CATCAA 2520 

AACCTATGCG TTCTAAATAG CGAATAGCTT CTGCAAGCCC AATTGCTTGA GCAATTAATG 2580 

GAGTACCCGC CTCAAATTTA GTAGG TAAAT CAGCCCATGT TGCATCATAC TTACTTACAA 264 0 

AATCAATCAT GTCGCCACCG AACTCAATCG GTTCCATTTT TTGTAGTAAC TCACGTTTAC 2700 

CAAATAATAC GCCAATACCT GTTGGTCCAA GCATTTTATG ACCACTAAAA CTATAAAAAT 2760 

CAGCATTCAT TTCTTGCATA TCAAGTTTCA TATGTGGTGC TGctTGCGCC CCATCAACAC 282 0 

TGATfiATTGC AC CATGTTGA TGAGCTATTT CTGCAATGGT TTTAACATCA TTAATTGTAC 2 8 80 

CGAGCACATT AGATATATGT GCAATAGCAA CGATCTTTGT TTTATCATTA ATCGTTTGCT 2 94 0 

TAATATCCTC GATGTTTAAT TCACCGTCAG CTGTCATTGG TATAAATTTC AATGTCGCAT 3 0 00 

TTTTACGCTT TGCTAACTGT TGCCAAGGAA CAATATTGGC ATGATGTTCC ATTTCAGTGA 3 06 0 

45 CAACAATTTC ATCGCCCTCT TCAACATTTG CATCACCATA GCTATGTGCT ACAAGGTTAA 3120 

TCGACGCAGT TGTTCCGCGT GTAAAAATGA TTTCTTCAAA AT ACTTCG CA TTAATAAAAC 3180 

GACGAACGGT TTCACGGGCA TTTTCATAAC CATCAGTTGC CAATGATCCT AATGTATGAA 324 0 

SO CACCACGATG AACGTTTGAA TTATAACGCT TGTAGTAATC TTCTAAAACA TTTAACACTT 3 3 00 

GCACAGGCGT TTGACTTGTC GCTGTTGAAT CAAGATATGC TAAACGTTTG CCATTGACTT 3360 
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CTTCATTCAC 


GACCTTTCTT 


AAATAAAAAT 


CCTAATCATT 


TAAATACTGA 


CGTTGTATTA 


3480 


GTCTTATACC 


AATATCGACA 


GTCTATATCT 


ATTACAAACT 


TTTATTTTCA 


AAATATTATT 


3540 


TAGAAACTTT 


GCGTTCAATT 


ACTTCTCTCA 


ATTGACGTTT 


AACGTCTTCG 


ATAGGTAATT 


3600 


CACGTACTAC 


TGGATCTAAG 


AAACCATGTA 


TAACAAGACG 


TTCCGCTTCT 


CTTTGAGAAA 


3660 


TACCACGACT 


CATTAAATAG 


TAAAGTTGAT 


CTGGATCAAC 


ACGACCTACT 


GATGCAGCAT 


3720 


GACCAGCTTG 


TACATCATCT 


TCATCAATTA 


ATAAAATAGG 


ATTCGCGTCA 


CCACGAGCAT 


3780 


GTTCAGATAA 


CATTAATACA 


CGTGATTCCT 


GATTAGCAAT 


TGATTTAGTT 


CCACCATGCT 


3840 


TAATGTAGCC 


GATACCATTA 


AATACAGACG 


ATGCATGTTC 


TTTCATAACA 


CCATGTTTAA 


3900 


GGATATAACC 


ATCTGTTTCT 


TTACCATATT 


GTACGATTTT 


AGATGTTAGA 


TTAA'ITITrT 


3960 


GTTCGCCTGT 


ACCTACAACT 


ACTGATTTAA 


GTGAACTTGT 


TGAACGATCA 


CCAAATAAAT 


4020 


TTGTTGTATT 


ATCAATAA 11 


TGGCTACCCT 


CATTCATTAA 


ACCTAGTGCC 


CAATTAATTG 


4080 


AGG CATCCGC 


TTCAGTAATA 


CCACGTCGAA 


TGATATGACC 


TGTAAAGCCT 


TTATCCATAT 


4140 


AGTCCACTGA 


GCCATATGTG 


ATATTTGAAT 


TTGCACCAGC 


AATCACTTCA 


GAAATAATAT 


4200 


TtAATTGATT 


TCCTTCACCA 


GATGCATTTG 


mTAAGTAATT 


TTCAACATAT 


GTGACTTCGG 


4260 


CGCTTTCTTC 


AGTAACGATG 










4280 



(2) INFORMATION FOR SEQ ID NO: 82: 

30 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 15S98 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
<D> TOPOLOGY: linear 

3S 



- (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 82: 



40 


TCnGACTCGA 


ACGGTGmAAC 


TAttCCGTTG 


TaATTCCgGA 


GgAAsCAAGG TATGCCCATC 


60 




TGCaAAGAAA 


gaATGsAATG AACTTriTGG 


AAATGTAGAA 


GTGGTAAAT A 


AAGATAAAGG 


120 




ATATTACATT 


CTGAGAAGTA 


TAAAAGCTTG 


AAATGAAATG 


GATATTCTGT 


TATAGTTATA 


180 


4S 


TAATGTAAAA 


ATTTATGTTC 


AATAAGTGTG 


TACTTTTACG 


TTAAATAGAT 


AAGTTAATTA 


240 




AGAATAAATA 


TAGAATCGAA 


AATGGTGTCA 


TCATTAGTGT 


TGCCGTTTTC 


TTTTTGTCTT 


300 




TTTATTAATA 


TGCTTATGGT 


ATTTAGCTAA 


AAGCGGATCA 


CATAATTTTT 


GAGGGGTGAA 


360 


SO 


TCTGTTTGGC 


AGGTCAAGTT 


GTCCAATATG 


GAAGACATCG 


TAAACGTAGA 


AACTACGCGA 


420 




GAATTTCAGA 


AGTATTAGAA 


TTACCAAACT 


TAATAGAAAT 


TCAAACTAAA 


TCTTACGAGT 


480 



55 



531 



EP0 786 519 A2 



10 



15 



20 



25 



30 



35 



40' 



45 



CTGGTAATTT 

AAGAATCTAA 
TCATTAAAGA 
TGACTGATAC 
TTCGTTCACC 
ATGCAACAAT 
TTGTATACGT 
TAGGTTTCTC 
ATACTTTAGA 
GTTTACGTCC 



A V. A A A VOi-VU. V_V_ 

TACATTTAAA 
CTGGTGAAAT 
TGGATGTACT 
ACGAGCCAGT 
CGACAACTGT 
ATATCATTGC 
ATATTGACCA 
TCCGTATCGG 
CTGAGTCTAT 
AATTSrrTTGG 
TAACGCATAA 



50 



AAATGGAAGT 
CTGAGGGACC 
TCGG CTTTAT 
AAATTGACTA 
AATTAGATGA 
ATACAGTTAT 
CAGCAGCGAC 



GTCATTAGAG 
AAACCGTGAC 
AAGAGGAGAA 
AGGTACGTTC 
ATCCGTTTAT 
TATTCCAAAC 
ACGTATTGAT 
AAGCGACCAA 
GAAAGACGGC 
AGGTGAACCA 
AAAACGCTAT 
ACATCGTTTA 
TGTAGTTGAA 
TGAATCAAAT 
AGAAATTCAA 
AATTGGTAAT 
TTCAATGAGT 
TTTAGGTAAC 
TTTATCAAGA 
CACACCTCAA 
TAGCTCTCAA 
ACGTCGTCTA, 
ACGTGACGTT 
AAACATTGGA 
TGAAAGACCA 
TTTAACAGCT 
AAATGGTCGT 
GGCTAAAGAA 
AgcATGTATT 



TTTGTGGATT 
GCTACTTATG 
GTTAAAGAAC 
GTTATCAATG 
TTCAATGAAA 
CGTGGTGCAT 
AGAACACGTA 
GAAATTGTTG 
ACTGAAAACA 
CCAACTGTTG 
GACTTAGCAA 
TTTAATCAAA 
GAAGGTACAG 
GCAAACAGCG 
TCAATTAAAG 
GCTTTCCCTG 
TACTTCTTTA 
CGTCGTTTAC 
ATGGAAAGAG 
CAATTAATTA 
TTATCACAAT 
TCAGCATTAG 
CACTACTCTC 
TTGATTAACT 
TATCGTAAAG 
GACGAAGAAG 
TTCATGGATG 
AAAATGGATT 
CCATTCTTAG 



ACCGTTTAGG 
CTGCACCTCT 
AAGAAGTCTT 
GTGCAGAACG 
AAATCGACAA 
GGTTAGAATA 
AACTACCATT 
ACCTTTTAGG 
CTGAACAAGC 
AAAATGCTAA 
GCGTGGGTCG 
AATTAGCTGA 
TGCTTGATCG 
AAGTGTTTGA 
TATATGTTCC 
ACTCAGAAGT 
ACTTATTAAG 
GTTCTGTAGG 
TTGTACGTGA 
ATATTCGACC 
TCATGGACCA 
GACCTGGTGG 
ACTATGGCCG 
CATTATCAAG 
TTGATTTAGA 
ATAGCTATGT 
ATGAAGTTGT 
ATATGGATGT 
AAAATGATGA 



AGAACCAAAA TATGATTTAG 
TCGTGTAAAA GTGCGTCTAA 
TATGGGTGAT TTCCCATTAA 
TGTAATCGTA TCTCAATTAG 
AAATGGTCGT GAAAACTATG 
TGAAACAGAT GCTAAAGATG 
AACAGTATTG TTACGTGCAT 
TGACAATGAA TATTTACGTA 
GTTATTAGAA ATCTATGAAC 
AAGTCTATTG TATTCACGTT 
TTATAAAACA AACAAAAAAT 
GCCAATTGTA AATACTGAAA 
TCGTAAAATC GACGAAATCA 
ATTGCATGGT AGGGTTATAG 
TAACGATGAT GAAGGTCGTA 
TAAATGCATT ACACCAGCAG 
CGGTATTGGA TATACAGATG. 
TGAATTACTA CAAAACCAAT 
AAGAATGTCA ATTCAAGATA 
TGTTATTGCA TCTATTAAAG 
AGCAAACCCA TTAGCTGAGT 
_TTTAACACGT ^GAACGTGCTC 
TATGTGTCCA ATTGAAACAC 
TTATGCACGT GTAAATGAAT 
TACACATGCT ATCACTGATC 
TGTAGCACAA GCAAACTCTA 
ATGTCGTTTC CGTGGTAACA 
ATCGCCGAAG CAAGTTGTTT 
CTCAAACCGT GCATTGATGG 



600 
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900 
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CAGGTATGGA ACACGTTGCA GCACGTGATT CTGGTGCGGC TATTACAGCT AAG CACAG AG 24 00 

GTCGTGTTGA ACATGTTGAA TCTAATGAAA TTCT TG TTCG TCGTCTAGTT GAAGAGAACG 2460 

GCGTTGAGCA TGAAGGTGAA TTAGATCGCT AT CCATTAGC TAAATTTAAA CGTTCAAACT 2520 

CAGGTACATG TTACAACCAA CGTCCAATCG TTGCAGTTGG AG ATGTTG TT GAGTATAACG 2580 

AGATTTT AG C AGATGGACCA TCTATGGAAT TAGGAGAAAT GGCATTAGGT AGAAACGTAG 264 0 

TAGTTGGTTT CATGACTTGG GACGGTTACA ACTATGAGGA TGCCGTTATC ATGAGTGAAA 2700 

GACTTGTGAA AGATGACGTG TATACTTCTA TTCATATTGA AGAGTATGAA TCAGAAGCAC 2760 

GTGATACTAA GTTAGGACCT GAAGAAATCA CAAGAGATAT TCCTAATGTT TCTGAAAGTG 2820 

CACTTAAGAA CTTAGACGAT CGTGGTATCG TTTATATTGG TGCAGAAGTA AAAGATGGAG 288 0 

ATATTTTAGT TGGTAAAGTA ACGCCTAAAG GTGTAACTGA GTTAACTGCC GAAGAAAGAT 2940 

20 TGTTACATGC AATCTTTGGT GAAAAAGCAC GTGAAGTTAG AGATACTTCA TTACGTGTAC 3 0 00 

CTCACGGCGC TGGCGGTATC GTTCTTGATG TAAAAGTATT CAATCGTGAA GAAGGCGACG 3060 

ATACATTATC ACCTGGTGTA AACCAATTAG TACGTGTATA TATCGTTCAA AAACGTAAAA 3120 

TTCAXGTTGG TGATAAGATG TGTGGTCGAC ATGGTAACAA AGGTGTCATT TCTAAGATTG 3180 

TTCCTGAAGA AGATATGCCT TACTTACCAG ATGGACGTCC GATCGATATC ATGTTAAATC 324 0 

CTCTTGGTGT ACCATCTCGT ATGAACATCG GACAAGTATT AGAGCTACAC TTAGGTATGG 3 3 00 

CTGCTAAAAA TCTTGGTATT CACGTTGCAT CACCAGTATT TGACGGTGCA AACGATGACG 3360 

ATGTATGGTC AACAATTGAA GAAGCTGGTA TGGCTCGTGA TGGTAAAACT GTACTTTATG 34 20 

ATGGACGTAC AGGTGAACCA TTCGATAACC GTATTTCAGT AGGTGTAATG TACATGTTGA 34 80 

AACTTGCGCA CATGGTTGAT GATAAATTAC ATGCGCGTTC AACAGGACCA TATTCACTTG 354 0 

tTACACAACA ACCACTTGGC GGTAAAGCGC AATTCGGTGG ACAACGTTTT GGTGAGATGG 3600 

AGGTATGGGC ACTTGAAGCA TATGGTGCTG CATACACATT ACAAGAAATC TTAACTTACA 3660 

AATCCGATGA TACAGTAGGA CGTGTGAAAA CATACGAGGC TATTGTTAAA GGTGAAAACA 3720 

TCTCTAGACC AAGTGTTCCA GAATCATTCC GAGTATTGAT GAAAGAATTA CAAAGTTTAG 37 80 

45 GTTTAGATGT AAAAGTTATG GATGAGCAAG ATAATGAAAT CGAAATGACA GACGTTGATG 3 84 0 

ACGATGATGT TGTAGAACGC AAAGTAGATT TACAACAAAA TGATGCTCCT GAAACACAAA 3 900 

AAGAAGTTAC TGATTAATAC GCAATTTACA AAACAGGCAA AAAGATACTA AGCTGAATTT 3 960 

50 TATTGATGAT TCAGTTTAGT ACTTTAAGCC ATTTTAAATA AATGCAAATC AATCAAATAG 4 020 

CACAGCTAAT CTAAATTGAA GGAGGTAGGC TCCTTGATTG ATGTAAATAA TTTCCATTAT 4 080 
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AAACCTGAAA 


CAATCAACTA 


CCGTACATTA 


AAACCTGAAA 


AAGATGGTCT 


ATTCTGTGAA 


4200 




AGAATTTTCG 


GACCTACAAA 


AGACTGGGAA 


TGTAGTTGTG 


GTAAATACAA 


ACGTGTTCGC 


4260 


5 


TACAAAGGCA 


TGGTCTGTGA 


CAGATGTGGA 


GTTGAAGTAA 


CTAAATCTAA 


AGTACGTCGT 


4320 




GAAAGAATGG 


GTCACATTGA ACTTGCTGCT 


CCAGTTTCTC 


ACATTTGGTA 


TTTCAAAGGT 


4380 


10 


ATACCAAGTC 


GTATGGGATT 


ATTACTTGAC 


ATGTCACCAA 


GAGCATTAGA 


AGAAGTTATT 


4440 


TACTTTGCTT 


CTTATGTTGT 


TGTAGATCCA 


GGTCCAACTG 


GTTTAGAAAA 


GAAAACTTTA 


4500 




TTATCTGAAG 


CTGAATTCAG 


AGATTATTAT 


GATAAATACC 


CAGGTCAATT 


CGTTGCAAAA 


4560 




ATGGGTGCAG 


AAGGTATTAA 


AGATTTACTT 


GAAGAGATTG 


ATCTTGACGA 


AGAACTTAAA 


4620 




TTGTTACGCG 


ATGAGTTGGA 


ATCAG CT ACT 


GGTCAAAGAC 


TTACTCGTGC 


AATTAAACGT 


4680 




TTAGAAGTTG 


TTGAATCATT 


CCGTAATTCA 


GGTAACAAAC 


CTTCATGGAT 


GATTTTAGAT 


4740 


20 


GTACTTCCAA 


TCATCCCACC 


AGAAATTCGT 


CCAATGGTTC 


AATTAGATGG 


TGGACGATTT 


4800 




GCAACAAGTG 


ACTTAAACGA 


CTTATACCGT 


CGTGTAATTA 


ATCGAAATAA 


TCGTTTGAAA 


4860 




CGTTTATTAG 


ATTTAGGTGC 


ACCTGGTATC 


ATCGTTCAAA 


ACGAAAAACG 


TATGTTACAA 


4920 


25 


GAAGCCGTTG 


ACGCTTTAAT 


TGATAATGGT 


CGTCGTGGTC 


GTCCAGTTAC 


TGGCCCAGGT 


4980 




AACCGTCCAT 


TAAAATCTTT 


ATCTCATATG 


TTAAAAGGTA 


AACAAGGTCG 


TTTCCGTCAA 


5040 




AACTTACTTG 


GTAAACGTGT 


TGACTATTCA 


GGACGTTCAG 


TTATTGCAGT 


AGGTCCAAGC 


5100 


30 


TTGAAAATGT 


ACCAATGTGG 


TTTACCAAAA 


GAAATGGCAC 


TTGAACTATT 


TAAACCATTC 


5160 




GTAATGAAAG 


AATTAGTTCA 


ACGTGAAATT 


GCAACTAACA 


TTAAAAATGC 


GAAGAGTAAA 


5220 


35 


ATCGAACGTA 


TGGATGATGA 


AGTTTGGGAC 


GTATTGGAAG 


AAGTAATTAG 


AGAACATCCT 


5280 


GTATTACTTA 


ACCGTGCACC 


AACACTTCAT 


AGACTTGGTA 


TTCAAGCATT 


TGAACCAACT 


5340 




TTAGTTGAAG 


GTCGTG CGAT 


TCGTCTACAT 


CCACTTGTAA 


CAACAGCTTA 


TAACGCTGAC 


5400 


40 


TTTGACGGTG 


ACCAAATGGC 


GGTTCACGTT 


CCTTTATCAA 


AAGAGGCACA 


AGCTGAAGCA 


5460 




AGAATGTTGA 


TGTTAGCAGC 


ACAAAACATC 


TTGAACCCTA 


AAGATGGTAA 


ACCTGTAGTT 


5520 




ACACCATCAC 


AAGATATGGT 


ACTTGGTAAC 


TATTACCTTA 


CTTTAGAAAG 


AAAAGATGCA 


5580 




GTAAATACAG 


GCGCAATCTT 


TAATAATACA 


AATGAAGTAT 


TAAAAGCATA 


TGCAAATGGC 


5640 




TTTGTACATT 


TACACACTAG 


AATTGGTGTA 


CATGCAAGTT 


CGTTCAATAA TCCAACATTT 


5700 




ACTGAAGAAC 


AAAACAAAAA 


GATTCTTGCT 


ACGTCAGTAG 


GTAAAATTAT 


ATTCAATGAA 


5760 


50 


ATCATTCCAG 


ATTCATTTGC 


TTATATTAAT 


GAACCTACGC AAGAAAACTT AGAAAGAAAG 


5820 




ACACCAAACA 


GATATTTCAT 


CGATCCTACA 


ACTTTAGGTG 


AAGGTGGATT 


AAAAGAATAC 


5880 
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GAAGTATTCA 


> ACAGATTTAG 


CATCACTGAT 


ACATCAATGA 


TGTTAGACCG 


TATGAAAGAC 


6000 




TTAGGATTCA AATTCTCATC TAAAGCTGGT ATTACAGTAG 


GTGTTGCTGA 


TATCGTAGTA 


6060 


5 


TTACCTGATA 


AGCAACAAAT 


ACTTGATGAG 


CATGAAAAAT 


TAGTCGACAG 


AATTACAAAA 


6120 




CAATTCAACC 


GTGGTTTAAT 


CACTGAAGAA 


GAAAGATATA 


ATGCAGTTGT 


TGAAATTTGG 


6180 


1 u 


ACAGATGCAA 


AAGATCAAAT 


TCAAGGTGAA 


TTGATGCAAT 


CACTTGATAA 


AACTAACCCA 


6240 


ATCTTCATGA 


TGAGTG ATT C 


AGGTGCCCGT 


GGTAACGCAT 


CTAACTTTAC 


ACAGTTAGCA 


6300 




GGTATGCGTG 


GATTGATGGC 


CGCACCATCT 


GGTAAGATTA 


TCGAATTACC 


AATCACATCT 


6360 


IS 


TCATTCCGTG 


AAGGTTTAAC 


AGTACTTGAA 


TACTTCATCT 


CAACTCACGG 


TGCACGTAAA 


6420 




GGTCTTGCCG 


ATACAGCACT 


TAAAACAGCT 


GACTCAGGAT ATCTTACTCG 


TCGTCTTGTT 


6480 




GACGTGGCAC 


AAGATGTTAT 


TGTTCGTGAA 


GAAGACTGTG 


GTACTGATAG 


AGGTTTATTA 


6540 


20 


GTTTCTGATA 


TTAAAGAAGG 


TACAGAAATG 


ATTGAACCAT 


TTATCGAACG 


TATTGAAGGT 


6600 




CGTTATTCTA 


AAGAAACAAT 


TCGTCATCCT 


GAAACTGATG 


AAATAATCAT 


TCGTCCTGAT 


6660 




GAATTAATTA 


CACCTGAAAT 


TGCTAAGAAA 


ATTACAGATG 


CTGGTATTGA 


ACAAATGTAT 


6720 


25 


ATTCGCTCAG 


CATTTACTTG 


TAACGCACGA 


CATGGTGTTT 


GTGAAAAATG 


TTACGGTAAA 


6780 




AACCTTGCTA 


CTGGTGAAAA 


AGTTGAAGTT 


GGTGAAGCAG 


TTGGTACAAT 


TGCAGCCCAA 


6840 




TCTATCGGTG 


AACCAGGTAC 


ACAGCTTACA 


ATG CGTACAT 


TCCATACAGG 


TGGGGTAGCA 


6900 


30 


GGTAGCGATA 


TCACACAAGG 


TCTTCCTCGT 


ATTCAAGAGA 


TTTTCGAAGC 


ACGTAACCcT 


6960 




AAAGGTCAAG 


CGGTAATTAC 


GGAAATCGAA 


GGTGTCGTAG 


AAGATATTAA 


ATTAGCAAAA 


7020 


35 


GATAGACAAC 


AAGAAATTGT 


TGTTAAAGGT 


GCTAATGAAA 


CAAGATCATA 


CCTTGCTTCA 


7080 


GGTACTTCAA 


GAATTATTGT 


AGAAATCGGT 


CAACCAGTTC 


AACGTGGTGA 


AGTATTAACT 


7140 




GAAQGTTCTA 


TTGAACCTAA 


GAATTACTTA 


TCTGTTGCTG 


GATTAAACGC 


GACTGAAAGC 


7200 


40 


TACTTATTAA 


AAGAAGTACA 


AAAAGTTTAC 


CGTATGCAAG 


GTGTAGAAAT 


CGACGATAAA 


7260 




CACGTTGAGG 


TTATGGTTCG 


ACAAATGTTA 


CGTAAAGTTA GAATTATCGA AGCAGGTGAT 


7320 




ACGAAGTTAT 


TACCAGGTTC 


ATTAGTTGAT 


ATTCATAACT 


TTACAGATGC 


AAATAGAGAA 


7380 


45 


GCATTTAAAC 


ACCGTAAGCG 


TCCTGCAACA 


GCTAAACCAG 


TATTACTTGG 


TATTACTAAA 


7440 




GCATCACTTG 


AAACAGAAAG 


TTTCTTATCT 


G CAG CAT CAT 


TCCAAGAAAC 


AACAAGAGTT 


7500 




CTTACAGATG 


CAGCAATTAA 


AGGTAAGCGT 


GATGACTTAT 


TAGGTCTTAA 


AGAAAACGTA 


7560 


SO 


ATTATTGGTA 


AGTTAATTCC 


AGCTGGTACT 


GGTATGAGAC 


GTTATAGCGA 


CGTAAAATAC 


7620 




GAAAAAACAG 


CTAAACCAGT 


TGCAGAAGTT 


GAATCTCAAA 


CTGAAGTAAC 


GGAATAACAA 


7680 
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ATGTTGACGA 


ATTCTCTTGT 


TCAATGTTAA 


TATATTAAAG 


GTTGATGCAA 


GCAGAACTTT 


7800 




GGAGGATAAA 


TTATTGTCTA AGGAAAAAGT 


t G CACGCTTT 


AACAAACAAC 


ATTTTGTAGT 


7860 


5 


TGGTCTTAAA 


GAAACGCTTA 


AAGCGTTAAA 


GAAAGATCAA 


GTTACATCTT 


TGATTATTGC 


7920 




TGAAGACGTT 


GAAGTATATT 


TAATGACTCG 


CGTGTTAAGC 


CAAATCAATC 


AGAAAAATAT 


7980 


10 


ACCTGTATCT 


TTTTTCAAAA 


GCAAACATGC 


TTTGGGTAAA 


CATGTAGGTA 


TTAACGTCAA 


8040 


TGCGACAATA 


GTAGCATTGA 


TTAAATGAGA 


ATTAGTAAGT 


GTTTTACTTA 


CTAAATTTTA 


8100 




TTTAACCTAA 


AAATGAACCA 


CCTGGATGTG 


TGGGATTAAA 


AAGTGAAGAG 


AGGAGGACAT 


8160 


15 


ATCACATGCC 


AACTATTAAC 


CAATTAGTAC 


GTAAACCAAG 


ACAAAGCAAA 


ATCAAAAAAT 


8220 




CAGATTCTCC 


AGCTTTAAAT 


AAAGGTTTCA 


ACAGTAAAAA 


GAAAAAATTT 


ACTGACTTAA 


8280 




ACTCACCACA 


AAAACGTGGT 


GTATGTACTC 


GTGTAGGTAC 


AATGACACCT 


AAAAAACCTA 


8340 


20 


actcagcgtt 


ACGTAAATAT 


GCACGTGTGC 


gTtTATCAAA 


CAACATCGAA 


ATTAACGCAT 


8400 




ACAT.CCCTGG 


TATCGGACAT 


AACTTACAAG 


AACACAGTGT 


TGTACTTGTA 


CGTGGTGGAC 


8460 




GTGTAAAAGA 


CTTACCAGGT 


GTGCGTTACC 


ATATTGTACG 


TGGAGCACTT 


GATACTTCAG 


8520 


25 


GTGTTGACGG 


ACGTAGACAA 


GGTCGTTCAT 


TATACGGAAC 


TAAGAAACCT 


AAAAACTAAG 


8580 




AATTTAGTTT 


TTAATTAAAT 


CTTAAACTTA 


AAATATTTAA 


TATAAGGAAG 


GGAGGATTTA 


8640 




CATTATG CCT 


CGTAAAGGAT 


CAGTACCTAA 


AAGAGACGTA 


TTACCAGATC 


CAATTCATAA 


8700 


30 


CTCTAAGTTA 


GTAACTAAAT 


TAATTAACAA 


AATTATGTTA 


GATGGTAAAC 


GTGGAACAGC 


8760 




ACAAAGAATT 


CTTTATTCAG 


CATTCGACCT 


AGTTGAACAA 




TGATGCATTA 


8820 


35 


GAAGTATTCG 


AAGAAGCAAT 


CAACAACATT 


ATGCCAGTAT 


TAGAAGTTAA 


AGCTCGTCGC 


8880 


GTAGGTGGTT 


CTAACTATCA 


AGTACCAGTA 


GAAGTTCGTC 


CAGAGCGTCG 


TACTACTTTA 


8940 




GGTTTACGTT 


GGTTAGTTAA 


CTATGCACGT 


CTTCGTGGTG 


AAAAAACGAT 


GGAAGATCGT 


9000 




TTAGCTAACG 


AAATTTTAGA 


TGCAGCAAAT 


AATACAGGTG^ 


GTGCCGTTAA 


GAAACGTGAG 

GTAAGATAAA 


-—9.060- 
9120 


40 


GACACTCACA 


AAATGGCTGA 


AGCAAACAAA 


GCATTTGCTC 


ACTACCGTTG 




AGCITTTACC 


CTGAGTGTGT 


TCTATATTAA 


TGAATTTTCA 


TTAAGCGTTC 


ATGCTTAGGG 


9180 


45 


CATCGCCATA 


TCTATCGTAT 


TTATTCAGTA 


ATATAAACTG 


GAAGGAGAAA 


AAATACATGG 


9240 




CTAGAGAATT 


TTCATTAGAA 


AAAACTCGTA 


ATATCGGTAT 


CATGGCTCAC 


ATTGATGCTG 


9300 




GTAAAACGAC 


TACGACTGAA 


CGTATTCTTT 


ATTACACTGG 


CCGTATCCAC 


AArGknGGTG 


9360 


50 


AAa CACACGA 


AGGTGCTTCA 


CAAATGGACT 


GGATGGAGCA 


AGAACAAGAC 


CGTGGTATTA 


9420 




CTATCACATC 


TGCTGCAACA ACAGCAGCTT 


GGGAAGGTCA 


CCGTGTAAAC 


ATTATCGATA 


9480 
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CAGTTACAGT 
AGGCTACAAC 
CTAACTTCGA 
TCCAATTACC 
AATGTTTCAA 
ACCACTTAGA 
GCGACGAATT 
AAGCTATCCG 
TCAAAAACAA 
TAGACGTTAA 
AAGCAGACGA 
TTGGTAAATT 
AGAACTCTAC 
CACGTCAAGA 
ATACAGGTAC 
AATTCCCAGA 
AAATGACTCA 
ACG AAGAAAC 
TAGACCGTAT 
ATCGTGAAAC 
GTCGTGGTCA 
TCGAATTCGA 
AAGCTGGTCT 
TTAAAGCTAA 
AAATTGCTGC 
AACCAATGAT 
ACGTAACATC 
TTAATGCTTA 
CTCAAGGTCG 



ACTTGATGCA 
TTATGGTGTT 
ATACTCTGTA 
AATTGGTGCG 
ATATACAAAT 
TAGAGCTGAA 
AATGGAAAAA 
CCAAGCTaCt 
AGGTGTTCAA 
ACCAATTATT 
TTCAGCTGAA 
AACATTCTTC 
TAAAGGTAAA 
AATCGATACT 
TGGTGATACT 
GCCAGTTATT 
AGCTTTAGTT 
TGGACAAGTT 
GAAGAAAGAA 
ATTCAAATCA 
ATACGGTGAT 
AAACGCTATC 
TAAAGATGCT 
ATTATATGAT 
ATCATTAGCA 
GAAAGTAACT 
TCGTCGTGGA 
TGTACCACTT 
CGGTACTTAC 



CAATCAGGTG 
CCACGTATCG 
AGTACATTAC 
GAAGACGAAT 
GATTTAGGTA 
GAAGCTCGTG 
TAT CTTGGTG 
AcTAACGTAG 
TTAATGCTTG 
GGTCACCGTG 
TTCGCTGCAT 
CGTGTGTATT 
CGTGAACGTG 
GTATACTCTG 
TTATGTGGTG 
CACTTATCAG 
AAATTACAAG 
ATCATCGGTG 
TTCAACGTTG 
TCTGCACAAG 
GTTCACATTG 
GTTGGTGGTG 
ATGGAAAATG 
GGTTCATACC 
CTTAAAGAAG 
ATTGAAATGC 
CGTGTTGATG 
TCAGAAATGT 
ACTATGTACT 



TTGAACCTCA 
TATTTGTAAA 
ATGATCGTTT 
TCGAAGCAAT 
CTGAAATTGA 
CTAGCTTAAT 
ACGAAGAAAT 
AATTCTACCC 
ACGCTGTAAT 
CTAGCAACCC 
TAGCGTTCAA 
CAGGTACAAT 
TAGGTCGTTT 
GAGATATCGC 
AGAAAAATGA 
TAGAGCCAAA 
AAGAAGACCC 
GTATGGGTGA 
AATGTAACGT 
TTCAAGGTAA 
AATTCACACC 
TAGTTCCTCG 
GTGTTTTAGC 
ATGATGTCGA 
CTGCTAAAAA 
CTGAAGAGTA 
GTATGGAACC 
TCGGTTATGC 
TCGATCACtA 



AACTGAAACA 
CAAAATGGAC 
ACAAgCTAAC 
CATTGACTTA 
AGAAATTGAA 
CGAAGCAGTT 
TTCAGTTTCT 
AGTACTTTGT 
TGATTACTTA 
TGAAGAAGAA 
AGTTATGACT 
GACATCTGGT 
ATTACAAATG 
TGCTGCGGTA 
CATTATCTTG 
ATCTAAAGCT 
AACATTCCAT 
GCTTCACTTA 
AGGTGCTCCA 
ATTCTCTCGT 
AAACGAAACA 
TGAATACATT 
AGGTTATCCT 
TTCATCTGAA 
ATGTGATCCT 
CATGGGTGAT 
TCGTGGTAAT 
AACATCATTA 
TGCTGAAGTT 



GTTTGGCGTC 
AAATTAGGTG 
GCTGCTCCAA 
GTTGAAATGA 
ATTCCTGAAG 
G CAGAAACT A 
GAATTAAAAG 
GGTACAGCTT 
CCTTCACCAC 
GTAATCGCGA 
GACCCTTATG 
TCATACGTTA 
CACGCTAACT 
GGTCTTAAAG 
GAATCAATGG 
GACCAAGATA 
GCACACACTG 
GACATCTTAG 
ATGGTTTCAT 
CAATCTGGTG 
GGCGCAGGTT 
CCATCAGTAG 
TTAATTGATG 
ATGGCCTTCA 
GTAATCTTAG 
ATCATGGGTG 
GCACAAGTTG 
CGTTCAAACA 
CCaAAATCaA 



9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
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GCCTAGGTTA AAATACAAGG TGAGCTTAAA TGTAAGCTAT CATCTTTATA GTTTGATTTT 1140( 

TTGGGGTGAA TGCATTATAA AAGAATTGTA AAATTCTTTT TGCATCGCTA TAAATAATTT ii 46 < 

CTCATGATGG TGAGAAACTA TCATGAGAGA TAAATTTAAA TATTATTTTT AATTAGAATA 11 52 ( 

GGAGAGATTT TATAATGGCA AAAGAAAAAT TCGATCGTTC TAAAGAACAT GCCAATATCG H58C 

GTACTATCGG TCACGTTGAC CATGGTAAAA CAACATTAAC AGCAGCAATC GCTACTGTAT 1164 C 

TAGCAAAAAA TGGTGACTCA GTTGCACAAT CATATGACAT GATTGACAAC GCTCCAGAAG 1170C 

AAAAAGAACG TGGTATCACA ATCAATACTT CTCACATTGA GTACCAAACT GACAAACGTC 11760 

, s ACTACGCTCA CGTTGACTGC CCAGGACACG CTGACTACGT TAAAAACATG ATCACTGGTG 11820 

CTGCTCAAAT GGACGGCGGT ATCTTAGTAG TATCTGCTGC TGACGGTCCA ATGCCACAAA 11880 

CTCGTGAACA CATTCTTTTA TCACGTAACG TTGGTGTACC AGCATTAGTA GTATTCTTAA 119 40 

20 ACAAAGTTGA CATGGTTGAC GATGAAGAAT TATTAGAATT AGTAGAAATG GAAGTTCGTG 12000 

ACTTATTAAG CGAATATGAC TTCCCAGGTG ACGATGTACC TGTAATCGCT GGTTCAGCAT 12060 

TAAAAGCTTT AGAAGGCGAT GCTCAATACG AAGAAAAAAT CTTAGAATTA ATGGAAGCTG 12120 

25 TAGATACTTA CATTCCAACT CCAGAACGTG ATTCTGACAA ACCATTCATG ATGCCAGTTG 12180 

AGGACGTATT CTCAATCACT GGTCGTGGTA CTGTTGCTAC AGGCCGTGTT GAACGTGGTC 12240 

AAATCAAAGT TGGTGAAGAA GTTGAAATCA TCGGTTTACA TGACACATCT AAAACAACTG 12300 

30 

TTACAGGTGT TGAAATGTTC CGTAAATTAT TAGACTACGC TGAAGCTGGT GACAACATTG 
GTGCATTATT ACGTGGTGTT GCTCGTGAAG ACGTACAACG TGGTCAAGTA TTAGCTGCTC 
CTGGTTCAAT TACACCACAT ACTGAATTCA AAGCAGAAGT ATACGTATTA TCAAAAGACG 

35 

AAGGTGGACG TCACACTCCA TTCTTCTCAA ACTATCGTCC ACAATTCTAT TTCCGTACTA 12540 

CTGAGGTAAC TGGTGTTGTT CACTTACCAG AAGGTACTGA AATGGTAATG CCTGGTGATA 126 00 

4Q ACGTTGAAAT GACAGTAGAA TTAATCGCTC CAATCGCGAT TGAAGACGGT ACTCGTTTCT 12660 

CAATCCGTGA AGGTGGACGT ACTGTAGGAT CAGGCGTTGT TACTGAAATC ATTAAATAAT 12720 
TTCTAATTTC TTAGATTTTA TATAAAAAGA AGATCCCTCA ATCGAGGGGt CTTTTTTTAA 
45 TGTGTAAATT TTGTAATGGC TATTCGATTT AGAAGAACAA TAATTGATGA AAGACTGACT 
AATAAAACTT ATAACTGATA ATACTGTTTA AATAAAATTG TTGAGTCTTG GACATTGTAA 
AATGCTCCCT TCAAAGTTTT CATTTTTTCa ATGTCTACTT TGAAGGGAGC ATTTCATTAG 
SO TTTATGTCTC AGATTCATAT CTTTCAATTA ATTTAAATGC TTAATTTGTT TTAAATACTT 



12360 
12420 
12480 



12780 
12840 
12900 
12960 



13020 



GCTCTAATTC TATGATTTTT AAAAATACAG CTACAGCGTA TTTTAATGAT TTTTCATCAA 13080 



S5 
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TCAGAAAGAA 


TGCACCTGGT 


CGTACTTTCA 


AATAATGTGA AAAATCTTCT 


CCAATCATCA 


13200 




TTAAATCTGA 


TTCATTAAAG 


CGTACATGTA AGTCATTTGT 


TGCTTCTTTA ATAACTTGAT 


13260 


5 


ATGCTTTCTC 


GTTATTATGG 


ACAGGCAAAT 


ACCCTTTAAT 


ATAATTCAAA 


TCATAGTTAA 


13320 




TATCATTTGC 


TATTGCTAAA 


CCTTGTAGAA 


GCTTATCCAT 


TTTGTCCATT 


ACATGATTCT 


13380 


10 


GTATATCTGA 


ATCGAAAGTT 


CTAACTGTAC 


CTTTACAAAA 


TGCTTGATCA 


GGAATAACGC 


13440 


TATCTGTGGT 


GCCTGCTTGA 


ATCATTCCAA 


ATGAAAGTAC 


AGCTTGTTTA 


ACTGGATCGA 


13S00 




TCGTACGTGA 


AATTAriTi-r 


TGTGCACTTA 


AAATGAACTC 


TGCCATGATT 


ACTATTGGGT 


13560 


15 


CAATGGTTTC 


ATGAGGTTTG 


GCACCATGAC 


CACCACGACC 


TTTAAATGTG 


ACGCTAAATT 


13620 


CATCTGGAGA 


GGCCATGATT 


GCCCCCGCAC 


GTGAATGAAT 


AGTTCCAGTA 


GGATAACCAC 


13680 




TCCATAAATG 


TGTACCGTAA 


ATTCTATCTA 


CATTTTCCAG 


ACATCCAGCA 


TCTATCATTT 


13740 


20 


CTTGAGAACC 


ACCTGGCATG 


ATTTCTTCAC 


CGTACTGGAA 


TATTAATACA 


ACATTACCTT 


13800 




CTAATAAATG 


TTTATGTTCA 


TCTAAAATCT 


CTGCTACAGT 


AAGTAAAATT 


GCTGTATGAC 


13860 




CATCATGCCC 


ACACGCATGC 


ATACATCCTG 


GATTTTTAGA 


CTTATAAGGC 


ACATCGTTTA 


13920 


25 


ATTCCTCGAC 


AGGTAACGCA 


TCAAAGTCAG 


CTCTTAATGC 


AATGGTAGGT 


CCTGTGCCCA 


. 13980 




AGCCTTTAAA 


TGTGGCTTTG 


ATACCATTGC 


GGCCGATAGG 


AGTTTCAATA 


TCACAAGATA 


14040 




ACTGGCTTAA 


TTGGTTAACA 


ATATAATCAT 


GTGTTTGAAA 


TTCTTCAAAA 


GATAACTCAG 


14100 


30 


GATATTGGTG 


TAAATAACGT 


CTGAGTTGAA 


TTGTTTTATT 


TTCTTTATTA 


TTTGCTAGTT 


14160 




GGAACCAATC 


TAACAC CCTT 


ATCACTACTT 


TCTAAAATAA 


TGTTTATAGT 


ATAACATTTT 


14220 


35 


ATGAAATTAT 


CGTACTAAAT 


GATTGCTTTG 


AGATATTTTA 


TCTATGAATG 


ATAAGGCTTT 


14280 


CAAGTTATGT 


AGAATTACTG 


TATGATAAAG 


GTATTACCAA ACAATACTTA AGGGGGATTA 


14340 




TATACTGTGG 


TTCAATCATT 


ACATGAGTTT 


TTAGAGGAAA 


ATATAAATTA 


TCTAAAAGAA 


14400 


40 


AATGGTTTGT 


ATAATGAAAT AGATACAATT 


GAAGGTGCAA 


ACGGACCAGA 


AATCAAAATC 


14460 


AATGGGAAAT 


CATACATTAA 


CTTATCTTCA 


AATAATTATT 


TAGGACTAGC 


AACAAATGAA 


14S20 




GATTTGAAAT 


CaGc t GCAAA AGCAGCTATT 


GATACACATG 


GTGTAGGTGC 


AGGCGCTGTT 


14580 


45 


CGTACAATCA 


ATGGTACATT 


AGATTTACAC 


GACGAATTAG 


AAGAAACACT 


AGCAAAATTT 


14640 




AAAGGAACAG 


AAGCTGCAAT 


AGCTTATCAA 


TCAGGATTTA 


ATTGTAATAT 


GGCTGCTATT 


1470O 




TCAGCTGTCA 


TGAATAAAAA 


TGATGCTATT 


TTATCAGATG 


AGCTTAATCA 


TGCATCAATT 


14760 


SO 


ATTGATGGAT 


GTCGCTTATC 


TAAAGCTAAA 


ATTATTCGAG 


TTAACCATTC 


AGACATGGAT 


14820 




GATTTACGTG 


CGAAAGCAAA AGAAGCAGTT 


GAATCAGGTC 


AATACAATAA 


AGTGATGTAT 


14880 
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ATTGCAGAAG AATTTGGTTT ATTAACTTAT GTTGACGACG CTCATGGTTC AGGTGTTATG 
GGTAAAGGCG CTGGTACGGT TAAACATTTT GGTTTACAAG ATAAAATCGA TTTCCAAATA 
GGTACGCTTT CTAAAGCAAT TGGTGTCGTT GGCGGTTATG TAG CAGGTAC AAAAGAGTTA 
AT AGATTGG T TAAAAGCACA ATCACGACCA TTCTTATTCT CTACATCATT AGCACCTGGG 
GAT AC CAAAG CAATAACTGA AGCAGTTAAA AAGTTAATGG ATTCAACTGA ATTACATGAT 
AAATTATGGA ACAATGCACA ATATTTAAAA AATGGATTGT CAAAATTAGG ATATGATACA 
GGTGAGTCAG AAACTCCAAT TACACCAGTA ATTATTGGTG ATGAAAAAAC AACTCAAGAA 
TTTAGTAAGC GTTTAAAAGA CGAAGGTGTC TATGTGAAAT CTATCGTTTT CCCAACAGTA 
CCAAGAGGTA CAGGACGTGT AAGAAATATG CCTACAGCTG CACATACAAA AGACATGTTA 
GATGAAGCAA TTGCGGCTTA TGAAAAAGTA GGAAAAGAAA TGAAGTTGAT TTAATATTTA 
TTTATTCCCA CGGCAAATAT TGTCGTGGGC TTTTTTTAAT GTTTAGTTTA TTAACAGT 
(2) INFORMATION FOR SEQ ID NO: 83: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 661 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 83: 
AAGTAAATCA ACTTACTGGG ATAAGAATAA AGG CG ATT AT AGTAACAAGT TGATTTTATT 
CGAAAAACAT TTTGAACCGG TTCTGGGTAT CAAGATGCAA CATAGTGGAG GTCATAGCTT 
TGGCCACACG ATTATTACGA TTGAAAGTCA AGGAGATAAA GCAGTTCATA TGGGTGATAT 
ATTCCCAACT ACTGCACATA AAAATCCTCT ATGGGTAACG GCATATGATG ATTATCCTAT 
GCAATCGATT CGTGAAAAAG AACGCATGAT AC CATATTTT ATTCAGCAAC AATATTGGTT 
CTTGTTTTAT CATGATGAAA ACTACTTTGC TGTAAAATAC AG CG ATAATG GTGAAAACAT 
AGATGCATAT ATTTTACGTG AAACATTAGT TGATAATAAC TAAAATAAAG ATGTATTACT 
AAACAAATTT TCAAAAATAA AAAATTGAGC CACATCCAAT CTTACTAATT AGGGTGTGGC 
TCATTTTTAA GTTTTACgAT CCAAATCAAA TATGGaTAAA ATTCgTATTA ACGCTCTACa 
ATGtTAATGA CTTCACCAGT ATATGCATCT GCATAAAAAT CATAATGAAT ATTTTGACCA 
TTTTTAATAG TTGTAATTCC ACCTTGATAA ACTAAACGGT ATTT AT CAGT TTCAGGATGA 
A 
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<i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 573 8 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi> SEQUENCE DESCRIPTION: SEQ ID NO: 84: 

10 





GCAGACGGTA 


CAGCAGTTAA 


AGTCGCACCA 


AaACTGTAGT 


GAATcTAATC 


GGTGcATTCT 


60 




TTTTAGGATT 


AGTTGTCGCG 


CTTATATATA 


TCTTCTTCAA 


AGTAATTTTC 


GATAAGCGAA 


120 


15 


TTAAAGATGA 


AGAAGATGTA 


GAGAAAGAAT 


TAGGATTGCC 


TGTATTGGGT 


TCAATTCAAA 


180 




AATTTAATTA 


AGGATGGTTG 


CTACTTATGT 


CAAAAAAGGA 


AAATACGACA 


ACAACACTAT 


240 




TTGTATATGA 


AAAACCAAAA 


TCAACAATTA 


GTGAAAAGTT 


TCGAGGTATA 


CGTTCAAACA 


300 


20 


TCATGTTTTC 


AAAAGCAAAT 


GGTGAAGTAA 


AGCGCTTATT 


GGTTACTTCT 


GAAAAGCCTG 


360 




GTGCAGGTAA 


AAGTACAGTT 


GTAT CGAATG 


TAGCGATTAC 


TTATGCACAA 


GCAGGCTATA 


420 




AGACATTAGT 


TATTGATGGC 


GATATGCGTA 


Age CAACACA 


AAACTATATT 


TTTAATGAGC 


480 


25 


AAAAXAATAA 


TGGACTATCA 


AGCTTAATCA 


TTGGTCGAAC 


GACTATGTCA 


GAAGCAATTA 


540 




CGTCGACAGA 


AATTGAAAAT 


TTAGATTTGC 


TAACAGCTGG 


CCCTGTACCT 


CCAAATCCAT 


600 




CTGAGTTAAT 


TGGGTCTGAA 


AGGTTCAAAG 


AATTAGTTGA 


TCTGTTTAAT 


AAACGTTACG 


660 


30 


ACATTATTAT 


TGTCGATACA 


CCGCCAGTTA 


ATACTGTGAC 


TGATGCACAA 


CTATATGCGC 


720 




GTGCTATTAA 


AGATAGTCTG 


TTAGTAATTG 


ATAGTGAAAA 


AAATGATAAr 


AATGAAGTTA 


780 


35 


AAAAAGCAAA 


AGCACTTATG 


GAAAAAGCAG 


GCAGTAACAT 


TCT AGGTGTC 


ATTTTGAACA 


840 


AGACAAAGGT 


CGATAAATCT 


TCTAGTTATT 


ATCACTATTA 


TGGAGATGAA 


TAAGTATGAT 


900 




TGATATTCAT 


AACCATATAT 


TGCCTAATAT 


CGATGACGGT 


CCGACAAATG 


AAACAGAGAT 


960 


40 


GATGGATCTT 


TTAAAACAAG 


CGACAACACA 


AGGTGTTACA 


GAAATCATTG 


TAACATCACA 


1020 


TCACTTACAT 


CCTCGATATA 


CCACACCTAT 


AGAAAAAGTG 


AAATCATGTT 


TAAACCATAT 


1080 




TGAAAGCTTA 


GAGGAAGTAC 


AAGCACTAAA 


TCTAAAGTTT 


TATTATGGTC 


AGGAAATAAG 


1140 


45 


AATTACCGAT 


CAAATCCTTA 


ATGATATTGA 


TCGAAAAGTT 


ATTAACGGTA 


TTAATGATTC 


1200 




ACGCTATTTA 


CTAATAGAAT 


TTCCATCAAA 


TGAAGTTCCA 


CACTATACTG 


ATCAATTATt. 


1260 




TTTCGAATCA 


CAGAGTAAAG 


GCTTTGTACC 


GATTATTGCA 


CATCCAGAGC 


GGAATAAAGC 


1320 


SO 


AATAAGTCAA 


AACCTTGACA 


TACTATACGA 


TTTAATTAAC 


AAAGGTGCTT 


TAAGTCAAGT 


1380 




GACAACGGcG 


TCATTAGCGG 


GTATTTCCGG 


TAAAAAAATT 


AGAAAATTAG 


CAATTCAAAT 


1440 
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GTTCTTAATG 


: AAAGACTTAT 


TTAATGATAA 


GAAATTACGT 


GATTATTATG 


AAGATATGAA 


1560 




CGGATTTATT AGTAATGCGA AGTTAGTTGT 


TGATGATAAA 


AAAATTCCTA 


AACGAATGCC 


1620 


5 


ACAACAAGAT 


TATAAACAGA 


AAAGATGGTT 


TGGGTTATAA 


ACAGCAAATG 


AGGGGTTTTA 


1680 




TGGCACATTT 


ATCTGTGAAA 


TTGCGGCTTT 


TAATACTAGC 


ATTAATCGAT 


TCACTGATAG 


1740 


10 


TGACATTTTC 


AGTATTCGTA 


AGTTATTACA 


TTTTAGAACC 


GTATTTCAAA 


ACATATTCTG 


1800 


TCAAATTATT 


AATATTGGCA 


GCTATATCAC 


TATTCATATC 


GCATCATATT 


TCaGCATTTA 


I860 




TTTTTAATAT 


GTATCATCGA 


GCGTGGGAAT 


ATGCCAGTGT 


GAGTGAATTG 


ATTTTAATTG 


1920 


15 


TTAAAGCTGT 


GACGACATCT 


ATCGTTATTA 


CGATGGTGGT 


CGTGACAATT 


GTTACAGGCA 


1980 




ATAGACCGTT 


TTTTAGATTG 


TATTTAATTA 


CTTGGATGAT 


GCACTTGATT 


TTAATAGGTG 


2040 




GCTCAAGGTT 


ATTTTGGCGT 


ATTTATCGGA AATACCTTGG 


AGGTAAGTCA 


TTTAATAAGA 


2100 


20 


AGC CAACTTT 


AGTTGTTGGT 


GCTGGTCAAG 


CAGGTTCAAT 


GCTGATTAGA 


CAAATGTTGA 


2160 




AAAGTGACGA 


AATGAAACTT 


GAACCGGTAT 


TAG CAGTCGA 


TGATGACGAA 


CATAAACGCA 


2220 




ATATCACAAT 


TACTGAGGGT 


GTAAAAGTCC 


AAGGTAAAAT 


TGCGGATATT 


CCAGAACTAG 


2280 


25 


TGAGGAAATA 


TAAGATTAAA 


AAAATCATCA 


TTGCAATTCC 


AACTATTGGT 


CAAGAGCGTT 


2340 




TGAAAGAAAT 


TAATAATATT 


TGCCATATGG 


ATGGCGTTGA 


GTTATTGAAA 


ATGCCAAATA 


2400 




TAGAAGACGT 


CATGTCTGGT 


GAGTTAGAAG 


TGAACCAACT 


TAAAAAAGTT 


GAAGTAGAAG 


2460 


30 


ATTTACTAGG 


CAGAGATCCT 


GTTGAATTAG 


ATATGGATAT 


GATATCAAAT 


GAATTGACGA 


2520 




ATAAAACTAT 


TTTAGTTACG 


GGTGCAGGTG 


GTTCAATAGG 


ATCAGAAATT 


TGTAGACAAG 


2580 


35 


TTTGTAATTT 


CTATCCAGAA 


CGTATTATTC 


TACTTGGCCA 


TGGTGAAAAC 


AGTATTTATT 


2640 


TAATCAATCG 


TGAATTOCGA 


AATCGCTTCG 


GwAAAAATGT 


TGATATCGTT 


C CT ATT ATAG 


2700 




CGGATGTGCA 


AAATAGAGCG 


CGTATGTTTG 


AAATTATGGA 


AACGTATAAA 


CCATACGCAG 


2760 


40 


TTTATCATGC 


AGCAGCACAC 


AAGCACGTGC 


CGTTAATGGA 


AGACAACCCT 


GAAGAAGCAG 


2820 


TACGTAATAA 


TATTTTAGGT 


ACGAAAAATA 


CTGCTGAAGC 


TGCTAAAAAT 


GCAGAGGTAA 


2880 




AGAAATTCGT 


TATGATTTCT 


ACGGATAAAG 


CCGTTAATCC 


GCCTAATGTC 


ATGGGAGCTT 


2940 


45 


CAAAGCGAAT 


TGCAGAAATG 


ATTATTCAAA 


GTTTAAATGA 


TGAAACGCAT 


CGAACAAATT 


3000 




TTGTTGCAGT 


GAGATTTGGT 


AATGTACTTG 


GATCGAGAGG 


ATCTGTGATT 


CCACTTTTCA 


3060 




AAAGTCAAAT 


TGAAGAAGGT 


GGGCCAGTTA 


CTGTGACACA 


TCCTGAAATG 


ACACGTTACT 


3120 


SO 


TTATGACAAT 


TCCTGAAGCT 


TCTAGACTAG 


TTTTGCAGGC 


AGGGGCATTA 


GCAGAAGGTG 


3180 




GCGAAGTATT 


TGTGCTAGAT 


ATGGGAGAAC 


CAGTGAAAAT 


TGTAGATTTG 


GCACGTAATT 


3240 



55 
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CCGGCGAAAA 


AATGTTTGAA 


GAGCTTATGA 


ATAAAGATGA 


GGTTCATCCT 


GAACAAGTAT 


3360 




TTGAAAAAAT 


TTATCGTGGC 


AAAGTACAAC 


ATATGAAATG 


TAATGAAGTT 


GAAGCGATTA 


3420 


5 


TTCAAGACAT 


CGTCAATGAC 


TTTAGTAAAG 


AAAAAATTAT 


TAACTATGCC 


AATGGCAAAA 


3480 




AGGGAGATAA 
GGTAATGCTG 


TTATGTTCGA 
TTATGAAACA 


TGACAAAATT 


TTATTAATTA 
TCTAATATTA 


CTGGGGGCAC 


AGGATCATTC 


3540 


10 


GTTriTAGAT 


AAGAAATTCG 


TATTTrrrcA 


3600 


CGCGATGAGA 


AAAAACAAGA 


TGACATTCGA 


AAAAAATATA 


ATAATTCAAA 


ATTAAAGTTC 


3660 




TACATTGGTG 


ATGTGCGTGA 


TAGTCAAAGT 


GTAGAAACAG 


CAATGCGAGA 


TGTTGATTAC 


3720 


1S 


GTATTCCATG 


CAGCAGCTTT 


AAAACAAGTG 


CCGTCATGTG 


AATTCTTTCC 


AGTTGAGGCA 


3780 




GTGAAGACAA 


ATATTATTGG 


TACAGAAAAT 


GTCTTACAAA 


GTGCTATTCA 


TCAAAATGTT 


3840 




AAAAAAGTCA 


TATGTTTATC 


TACAGATAAG 


GCAGCGTATC 


CTATTAATGC 


TAGGGGTATT 


3900 


20 


TCAAAAGCAA 


TGATGGAAAA 


AGTATTCGTA 


GCCAAATCAA 


GAAATATTCG 


TAGTGAACAA 


3960 




ACGCTTATTT 


GTGGTACAAG 


ATACGGTAAT 


GTGATGGCTT 


CAAGAGGATC 


AGTAATACCT 


4020 




TTGTTTATCG 


ACAAAATCAA 


AGCTGGAGAA 


CCTTTAACGA 


TTACAGATCC 


TGATATGACA 


4080 


25 


AGATTTTTAA 


TGAGCTTAGA 


AGATGCGGTA 


GAACTAGTTG 


TTCATGCATT 


TAAGCATGCA 


4140 




GAGACAGGAG 


ATATTATGGT 


TCAAAAAGCA 


CCAAGCTCAA 


CGGTAGGGGA 


TCTTGCGACC 


4200 




GCATTATTAG 


AATTGTTTGA 


AGCTGATAAT 


GCAATTGAAA 


TCATTGGTAC 


GCGACATGGA 


4260 


30 


GAGAAAAAAG 


CAGAAACATT 


GTTGACGAGA 


GAAGAATACG 


CACAATGTGA 


AGATATGGGT 


4320 




GATTATTTTA 


GAGTGCCGGC 


AGACTCCAGA 


GATTTAAATT 


ATAGTAATTA 


TGTTGAAACC 


4380 


35 


GGTAACGAAA 


AGATTACGCA 


ATCTTATGAA 


TATAACTCCG 


ATAATACACA 


TATTTTAACG 


4440 


GTGGAAGAGA TAAAAGAAAA ACTTTTAACA 


CTAGAATATG 


TTAGAAACGA 


ATTGAATGAT 


4500 




TATAAAGCTT 


CAATGAGATA 


GGAGAGATTG 


ACGTTGAATA 


TTGTAATTAC 


AGGAGCAAAA 


4560 


Aft 


GGTTTTGTAG 


GAAAAAACTT 


GAAAGCAGAT 


TTAACTTCAA 


CGACAGATCA 


TCATATTTTC 


4620 




GAAGTACATC 


GACAAACTAA 


AGAGGAAGAA 


TTAGAGTCAG 


CATTGTTGAA 


AGCAGACTTT 


4680 




GTCGTG CATT 


TAGCGGGTGT 


TAATCGACCT 


GAACATGACA 


AAGAATTCAG 


CTTAGGAAAC 


4740 




GTGAGTTATT 


TAGATCATGT 


ACTTGATATA 


TTAACTAGAA 


ATACGAAAAA 


(Iff AfVYS A T 21 


a o n f\ 




TTATTATCGT 


CTTCAATACA 


AGCAACACAA 


GATAATC CTT 


ATGGTGAGAG 


TAAGTTGCAA 


4860 




GGGGAACAGC 


TATTAAGAGA 


GTATGCCGAA 


GAGTATGGCA 


ATACGGTTTA 


TATTTATCGC 


4920 


SO 


TGGCCAAATT 


TATTCGGCAA 


GTGGTGTAAG 


CCGAATTATA 


ACTCAGTGAT 


AGCAACATTT 


4980 




TGTTACAAAA 


TTGCACGTAA 


CGAAGAGATT 


CAAGTTAATG 


ATCGGAATGT 


TGAACTAACG 


5040 
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5 



10 



15 



ATTGAAAATG 


GTGTACCTAC 


AGTACCAAAC 


GTATTTAAAG 


TGACATTGGG 


AGAAATTGTA 


5160 


GATTTATTAT 


ACAAGTTCAA 


ACAGTCACGT 


CTCGATCGAA 


CATTGCCGAA 


ATTAGATAAC 


5220 


TTGTTTGAAA 


AAGATTTGTA 


TAGTACGTAT 


TTAAGCTATC 


TACCTAGTAC 


aGACTTTAGT 


5280 


TAyCCCTTAC 


TTATGAATGT 


GGATGATAGG 


GGTTCTTTTA 


CAGAATTTAT 


AAAAACACCG 


5340 


GATCGTGGTC 


AAGTTTCTGT 


AAATATTTCT 


AAACCAGGTA 


TTACTAAAGG 


TAATCACTGG 


5400 


CATCATACTA 


AAAACGAAAA 


ATTTCTAGTC 


GTATCAGGTA 


AAGGGGTAAT 


TCGTTTTAGA 


5460 


C A TY3TT A AT£2 


ATf2 AT^ A A AT 


C* A TTfZ A 2V T & T 








c c *^ n 


GACATACCAG 


TAGGATACAC 


ACATAATATT 


GAAAATTTAG 


GCGACACAGA 


TATGGTAACT 


5580 


ATTATGTGGG 


TGAATGAAAT 


GTTTGATCCA 


AATCAGCCAG 


ATACGTATTT 


CTTGGAGGTA 


5640 


TAGCGCATGG 


aAAAACTGAA 


rTTAATGACA 


ATAGTTGGTA 


CAAGGCCTGA 


AATCATTCGT 


5700 


TTATCATCAA 


CGATTAAAGC 


ATGTGATCAA 


TATtTTAA 






5738 



(2) INFORMATION FOR SEQ ID NO: 85: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9062 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 85: 
ATCATCAACA AGAATGATAT TTTTCCCATC TACTATATCT TTTACCGCAG ATAACTTCAC 60 
TCTCACACCT TGCTCACGTA ATTCTTGAGT TGGTTGAATA AATGTTCTTG CAACATATTG 120 

35 

ATTTTTAACT AGTC CCATTT CATATGGCAA ACCTATTTCT TCAGCATAAC CACTCGCAGC 180 
TGATAGCGAT gAATTGGGTA CACCGATGAC CATATCAGCA TTTACAGGGC TTTCTTGGGC 240 
_ „ _ JTAATTTTTTA JC CAGAAG CTTT_TACGTACTGC„ ATGGACATTT. _TTACCAGCTA -TTGTTGAGTC 300 

40 

TGGTCTAGCA AAATAAATAT ATTCCATCGC AGAAATTGCA GTTGTCGTAT GATGTGTATA 360 

AGATTTAACT GTAAT AC CTT TATCGTTAAT CACGACATAT TCACCTGCAT GAATATCTTG 420 

45 AACAAATTCT GCACCTAACA CATCTATTGC ACATGTTTCA CTTGCAAGGA TGTATGTCCC 480 

ATCTTTCATT TTACCTACAA CAAGTGGTCT GATAGCATTT GGATCTACTG CGCCATATAA 54 0 

CGCATCTTTA GTTAAAATCG CAAATGTAAA ACCGCCTTTA ACTTTTCGCA AACTTTCTTT 600 

50 CAACGCTTCC TCAAAAGTAG GAGCTTTACT TCGACGTATC AAATGCATAA TGACTTCAGT 660 

AT CAG AAGAC GAATGGAAGA TAGCACCTTG TTTTTCTAAA TTCTGACGCA ATGATTTAGC 720 
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CGGTTGAATA TTTTCAATAC CTTTATTACC 
ATGTTGATAT CCTTTTAATC GTTCCATTTG 
5 TAATCCTCGC TCGCCTTTTA ATTCATTTTG 

ACCACGATGT TGCAAACTAT GAAGTCCCAT 
CCAAATACCA AACACGCCAC ATTCTTCGTT 

10 

GCCCCtTCCC ATATTTGTTT AAT AT CTGAA 
GTTACCTTGr aATTAT CACT ATCTGTTAAA 
AAAGTTTTAC CTGATTTAAC AGAAACAACA 

75 

GCATTTGTTA TATCTATTGA AGATTTTAAT 
AAGGTAATCA GTAAGCCACC TTTACCAACT 

2G ATAGCGGTCT TGATTGATTC ACCTTTTTCA 

TCATGATTAA CTTTGCCATA AATTAACTTT 
GTATCACCGA TTAAATATAA TTTATCTCCA 

25 ACATTTTCAA TCAAACCTAC CATTCCAACA 

GTTTCGTTAT ATAAAGATAC ATT AC CAGAA 
TCTGCCATAC CTTTCGTTGA ATCTATCAAC 

30 C CATAATTTA AACAATCTGT CATTGCTAAT 

TAAGCTTCAG CTACTACCAT CTTTCCACCT 
TCACCATCAA TTGTTGAAGC AATTG CCTTA 

35 

TGAAGTCCTG GCTTAATTAT CGTATTGGCA 
TAGTCTTTAG ATGCTATAGT CGGATGCTTA 
ATGTGTGTAT AATCATTTTT AGAAGTATTA 

40 

ACAGGTGCTT CATCAGCTAG TGGTTCAACT 
GTTAAAACAA AACGATTTGT ATCTGTAACT 

45 TTATCAAATA AATCTAAGAA TTTTTGTTCA 

TCTTGAGTTT CTGAAAGCAT CATTTCATAA 
TGTTCTAATC TCAAATGTAA CCCACTACCA 

SO GTTAAACCAG CAGCACCCAT ATCTTGAATA 

AGTGTTGCTT CCATTAATTT TTTACCTACA 
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TGAAGTAGCA TAACGGACGT GACCAATTGC 84 0 

ATCATCTTTA ATCGCTTCAG TTAGTAAGCC 900 

ATCAGAAACA ACTATACCTG CACCTTCTTG 960 

ATA t GTTAGT TGCGCTGCtT CaGGATGATT 1020 

TAATCCTGAG TAGTTAAACA TTGaGCAATT 10 BO 

ACATTTTCAC TAATCTCTGT aTATGGTGTT 114 0 

AGTCCAATTT CTATTGCATT ATCAATATTT 1200 

TATCGGCCTT GCGTCTCACT AAACAATTGT 1260 

CCTAAACCGT AATGCGCACT TAGTTTAGCT 1320 

GTTTGAACAT GTGATAATAG TCCTTCACGA 1380 

ACTTCTGAAC TCAAATCTAA TGACTCAAAT 1440 

TCAAGTTGAC TACCACCAAA GTCGTCCTTA 1500 

ACTTGAGGTT CAAAATCATT TAAATAATTT 156 0 

ACTGGTGTTG GGAAAATAGA AGTACCTTTC 1620 

ACTACTGGTG TCTTAAGAAT GTCGCATGCT 1680 

TGTTGATAGA TTTCTTTCTT TTCAGGAGAA 174 0 

GGTGTTGCAC CCACGGCAAT TAAATTTCGA 1800 

TCATATGGAT TGTTATATAC ATAACGCGCT 1860 

TTTGTGCCTT CCACACGTAC TACCGATGCT 1920 

CCAACTTGTT GGTCGTATTG ATCATATAAA 1980 

AGTAATTTAA AGAAAGTATC TTTAACATCG 2040 

TAATCTTTTT CTTCTCCTTC TAAAATATAT 2100 

GGAATGTCAG CATAAACTTC GTCATCATAT 2160 

TCACCTATAA CAGCACTATC CAATTCGTGC 2220 

GTACCTTTTT CAACAACTAG TAACATACGT 2280 

GGAGAAATAC CTGGCTCACG TGTTGGCACT 234 0 

CCTTTTGCCG CCATTTCAGA CGATGAAGAT 24 00 

CCAACTAATT CATCAAATGT AATTG CTTCA 2460 

AATGGATCAC CGATTTGTAC AGAAGGTCGT 2520 
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CGACCAGTTT TCAAACCAAC ATAAATGACC GAATTACCTA CACCTTTTGC TGTGCCTTTT 2S4 
TGAATCATGT CGTGATTGaT AACACCAACA CACATTGCAT TAACAAGTGG ATTGCCATCA 270 
5 TAACGTTCAT CAAATTCGAT TTCACCAGCA GTTGTTGGaA TACCAATGCA GTTACCATAA 2 76 

CCTCCGATAC CCTTTACAAC ACCTTTAAGT AATCTTTGGT TTTGTTTATT ATCTAATTCT 2 82l 

CCAAATCTAA GACTGTTTAA CAAATTAATA GGTCTAGCCC CAATAGAGAC AATGTCACGA 2 8 8. 

10 - 

ATGATTCCAC CAACGCCTGT AGCAGCCCCT TGATATGGTT CAATTG CTGA TGGATGATTG 294( 

TGAG ACTCTA CTTTAAATAC TACGGCTTGA TTATCACCTA TATCGACTAC CCCTGCACCT 3 00( 

75 TCACCAGGCC CCATAAGCAC ATGGTcACCT GACGTAGGAA ATTGCTTTAA AAACGGTTTA 3 06C 

GAATGTTTAT AAGAGCAATG TTCACTCCAC ATAACAGAAA AGATACCTGT TTCTGTAAAG 312C 

TTAGGTTGTC TGCCTAAAAT ATCGCAAACT TTTTCATATT CTTGATCaCT T AAT CC CAT A 318c 

20 TCTTGATATA CTTTTTCAAG TTTAATTTCT TCAACGCTTG GTTCGATAAA TTTAGACATG 324 0 

TTGTTCCCTC CAACTTTTTA CCATCGCTTC AAATAATTTC ACACCACTAT CAGTACCTAA 33O0 

CAACGTTTCT AAAGCTCTTT CagGATGtGG CATCATGCCA CATACATTGC CTTTTTCGTT 3360 

AACAATTCCT GCAATATCAT CATATGAACC GTTCGGATTA TTCACATATT TCAGAATAAT 3420 

TTGATTGTTA GCTTTTAATT GTTGATATAT TTCATCAGTA CAATAATAAT GACCTTCACC 3480 

GTGAGCTACA GGATATATAA CTTTTTCACC TTGTTCATAA AGATTTGTAA ATGCCGTTTG 3 54 0 

ATTATTCACT ATTTCTAACT CTTCATTTCT ACTAATAAAT AAATGTGAAT CGTTATGCAA 3 600 

TAATGCACCA GGTAATAAGC CTATTTCAGT TAAAATTTGA AACCCATTAC AAACACCTAA 3660 

TACTGG CTTA CCTTCAGCTG CAAGACGTTT AACTTCCGAA ATAATCGGsG CTACACTAGC 3720 

CATTGCCCCA GATCTTAAGT AATCCCCGAA TGAAAATCCA CCAGGAATAA GTACG C CATC 3780 

AAAT6CACTT AGTGATGTTT CTCTATAATC TACATATTCC GCTTCAACAC CACTTTTAAT 3840 

40 AGCAG S ATTA ^^^^^^^^^TT.C^CCTGGA , AAAACAAGAA_ COGCAAATTT 39.00 

CATTTTATGC ATTCTCCTTT TCATCATCTA ACACTTTATA GCTATATTCT TCAATCACTG 3960 
TATTTGCAAA CAATTTTTCA CTTAGAGTTG TAATAATGTT GTGTACCTTT TCATCACTAA 
4S CCTCATCCAC TGTCATATAT AATACTTTTC CTACACGAAT ATCATTCACT TGTGCATAAC 
CTAAGTCATG TACAGCTCGA GTAAGCGTTT GTCCTTGCGT ATCTAATACT TGTGGTTGTA 
ATGTGATATG TAGTTCAATT GTTTTCATTA TTTTAAATCC TCCAATTTGT TTAAAAATAT 
TTGATATGTT TCAATCACTG ATCCAGTGTT ATTTCTATAT ACATCTTTAT CAAAGTTTGC 



25 



30 



35 



4020 
4080 
4140 
4200 



SO 



4260 



ATTGGTAGCT TTATCCCAAA TTCGACATGT ATCTGGAGAT ATTTCATCCG CTAACAAAAT 4320 
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ATCCATTAAT 


TGTTTCAACA 


CATTATTAAT 


CTTTAATGCT 


TTGGATTTTA 


GTATTTCAAT 


4440 




ATCTTCATCT 


GATGCTATAT 


TGAGCAATTT 


AACATGGTCA 


TCCGTTATCA 


ACGGATCATT 


4500 


5 


TAACGCATCA 


TTTTTATAGA 


AAAATTCTAC 


AAGTGGTTCT 


CTAAAAACTT 


CACCATTTTC 


4560 




AAAACCTAAA 


CGCTTTGTAA 


TAGATCCACT 


AGCAATATTA 


CGAACAACTA 


CTTCTAATGG 


4620 


10 


AATTATTTTC 


ACAGGCTTAA 


CTAATTGTTC 


TGTTTCAGAT 


AATTGTTTAA 


TAAAGTGACT 


4680 


TTCTATTCCA 


TTTTCTTGTA 


AATATTTAAA 


TATAATAGAA 


GTAATTTGAT 


TATTTAATCG 


4740 




CCCCTTACCT 


GCCATTGTGT 


CTTTCTTAGC 


CCCGTTTCCA 


GCAGTAACTT 


cat err r ata 


4800 


15 


TTCAACTCTT 


AATTCATTTT 


CTTGATTTGT 


TGAGAAAATG 


CGcTTCGCTT 


TTCCTTCATA 


4860 


TAATAATGTC 


ATGCTTTAAT 


TACTCCCCTC 


AAATTTAGCG 


TACATATCTT 


GTTCAGTTTG 


4920 




GTTTACATCA 


TTCGTTAGTA 


CAGTCATATG 


ccccattttt 


CTGCTATCTT 


TACGCTCAGA 


4980 


20 


CTT AC CAT AA 


ATATGTAAGT 


GCCACTCTGG 


ATGTTCATTA 


AATTCATTTT 


CCAATAAATC 


5040 




TAAATCTTTA 


CCTAGTAAGT 


TCATCATGAC 


TGCTGGCTTT 


AATAATTCAA 


TTGAATTTGG 


5100 




TAATGATTGT 


CCGGTAACTG 


CTAAAATATG 


AGTATCAAAT 


TGTGAATAAT 


CACATGCTTC 


5160 


25 


AATTGAATAA 


TGTCCGGAAT 


TGTGAGGCCT 


TGGTGCTATC 


TCGTTCACAT> 


ACAATTGGTT 


5220 




GTTACTATCT 


ATAAAAAATT 


CAACTGTAAA 


TGTTCCAATG 


AAATGAATCG 


ATTGGATAAT 


5280 




TTTATTAACT 


TGCTCTTTCG 


CCTCAGCTGT 


TTTATCTATT 


CTCGCTGGAA 


CAATTGTTTT 


5340 


30 


GAAAAGTATT 


TGATTTCTAT 


GCTCATTTTC 


TTGTAATGGG 


AAAAAAGTGA 


TTTGATTGTT 


5400 




GTTTCCTCTT 


GTAACAGTAA 


GAGATACTTC 


TTTCTTGATA 


TTCAAATATT 


TTTCAGCTAC 


5460 




GCATTCACTA 


GTTTCAATTA 


ATTTAAAACC 


TTCTTGTAAG 


TCTTTTTCGT 


TGTTAATTAA 


5520 


35 


AACTTGACCT 


TTG CCATCGT 


AGCCACCAAA 


TCTAGTTTTT 


ACAATAAAAG 


GATATCCTAA 


5580 




TGTTffCAATT 


GCTTTGTCAA 


TATCTGTAGA 


TTCTTTTACT 


GAAATGAACG 


GGACAACTTT 


5640 


40 


GGTACCAGCA 


CTTTTTAATG TTTCTTTTTC AGTTAAGCGA 


TCTTGTAATA 


ACTGTATAGC 


5700 


TTGGTAACCT 


TGCGGAATAT 


TGTACTTTTC 


ACATAATAGT 


TTTAATTGTT 


GGGCTGAAAT 


5760 




GTTTTCAAAT 


TCATAAGTAA 


TCACATCACA 


TTTTTGTCCT 


AATTGATTGA 


GTGCCTTTTC 


5820 


45 


ATCGTCATAC 
AGGATCCAAT 


TTGGCTTGTA 
ACAACCACTT 


TAAATTCGTG 
TATAACCCAT 


TGCAACGTAT 


CTACATGGAC 


AATCTTCAGA 


5880 




TTTTTGAGCT 


GATTGTGCCA 


TCATCTTTCC 


5940 




AAGCTGACCA 


CCAC CAATAA 


TGCCAATAGT 


CGCACCAAAC 


TTTAATTTAT 


TGAAGTTCAT 


6000 


SO 


TTTGCATGTC 


CTCCACTTTT 


TGAATTAACG 


AAGATTCATA 


CTGATTTAGT 


TTTTCAACTA 


6060 




AAGAAGGATT 


TTGAATACTT 


AACATTCTTG 


CTGCAAGTAT 


ACCTGCGTTT 


TTAGCACCTG 


6120 
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AAGAATCTAT ACCCTTTAAA Cm-TT U TTT CAATCGGCAC TCCAATAACT GGTAGCGTCG 
TTAATGATGC AACCATACCT GGTAAATGTG CCGCACCGCC AGCGCCTGCA ATGATAATGT 
5 TTATACCTCT TTCTCTCGCT TCAGAAGCAA ATTGAACCAT CATTTTTGGC GTACGATGTG 

CGGATACTAC TTGTTTTTCG TACGGAATTT CAAAATAATC CAACATGTTA CAACTCTCTT 
GCATAATTTT CCAATCGGAA GAACTGCCCA TAATGACTGC TACTTTCACT TTGTACACCC 
TTTCAAAAGT TTGAATTGTG AATTACTTTA GTTGTATATT ATAGATATAG CATAACAAGC 
AATTTCTGCT TTTTCAATCA AAAATCGAAC TTTATTTTGA TTTTTTATTT GAATTTACGT 
, 5 CTTTTGCTAT GTAAATTAGT TTTATAAACT AACAAAGTTA GGATATTGAC AATAGGAGGA 

GAAGTTTTTA TGGTTGCTAA AATTTTAGAT GGTAAACAAA TTGCCAAAGA CTACAGACAG 
GGGTTACAAG ATCAAGTTGA AGCGCTAAAA GAAAAGGGTT TTACACCTAA ATT AT CCGTT 
20 ATATTAGTTG GTAATGATGG CGCTAGTCAA AGTTATGTTA GATCAAAAAA GAAAG CAGCT 

GAAAAAATTG GTATGATTTc AGAAATCGTA CATTTGGAAG AAACAGCTAC TGAAGAAGAA 
GTATTAAACG AACTAAATAG ACTAAATAAT GATGATTCTG TAAGTGGTAT TTTGGTACAA 
25 GTACCATTAC CAAAACAAGT TAGCGAACAG AAAATATTAG AAGCAATCAA TCCTGAAAAA 

GATGTGGACG GTTTTCATCC AATAAATATA GGGAAATTAT ATATCGATGA ACAAACTTTT 
GTACCTTGCA CACCGCTCGG CATCATGGAA ATATTAAAAC ATGCTGATAT TGATTTAGAA 
30 GGTAAAAATG CAGTTGTAAT TGGACGAAGT CATATTGTCG GACAACCAGT TTCTAAGTTA 

CTACTTCAAA AAAATGCATC AGTAACAATC TTACATTCTC GTTCAAAAGA TATGGCATCA 
TATTTAAAAG ATGCTGATGT CATTGTCAGT GCAGTTGGTA AGCCTGGTTT AGTAACAAAA 

3S 

GATGTGGTCA AAGAAGGAGC AGTAATTATC GATGTTGGCA ATACGCCAGA TGAAAATGGC 
AAATTAAAAG GTGACGTTGA TTATGATGCG GTTAAAGAAA TTGCTGGAGC TATTACACCA 

4Q GTTCCTGGTG GCGTTGGTCC ATTAACAATT ACTATGGTAT TAAATAATAC -TTTGCTTGCA 

GAAAAAATGC GTCGAGGTAT TGATTCGTAA AGAGCCTGAG ACATAAATCA ATGTTCTATG 

CTCTACAAAG ttataatggc agtagttgac tgaacgaaaa ttcgcttgta acaagctttt 

45 TTCAATTCTA GTCAACCTTG CCGGGGTGGG ACGACGAAAT AAATTTTACG AAAATATCAT 

TTCTGTCCCA CTCCCTAATA ACTGAGTTTT AATGAAGTCT TTTAACCCAC ATTAAATATT 
ATTTTGCAAT TGCAATGAAT AACAAGAAAA ATCTGGGACA TTAATGGATC AAATGCTCCC 

SO TTCAAAGTAG ACATTGAATA AATGAAGGCT TTGAAGGGAG CATTTCACTT TGTACTTGGC 

TCAACAATTT TATATAGACA GTAGTTAATT GAATGAAAAT AAGCTTGTAA CAAGTTTTCA 
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GTTGGGGATG GGCCCCAACA CAGAAGCTGT GACTATGATA AAGTACTACT ACATAGTTAA 804 0 

TCATTAGTGG TTCTTTATCA TTTTCGCCTC CCTTTTCTTA TTGTTTTGAT ACACAAAAAT 8100 

TTAAGTTCAA ACTGTCGAAT AAAGTTATAT TTGATTTCAA ATTATCCCTA AATTATTAAT 8160 

TkTACAATTG TGGCAGATTT TCAAAATAAT AATTATTTCC TCATTATTTA TAAATTTATA 8220 

TTTAAATTTC ATTCTTTATA GGGTAAGATT AGGACTATAG TATGATGTGT ArATAATATA 8280 

AATTAAGGTA TAGTAAAGCT AACTCAGAAA TGACTTATCA TTCGGAGGTT ACATTATGAA 8 34 0 

TAAACTATTA CAGT CATTAT CAGCCCTCGG TGTTTCTGCT ACACTAGTAA CACCAAATTT 84 00 

AAATGCAGAT GCAACGACGA ATACTACACC ACAAATTAAA GGCGCTAATG ATATCGTTAT 8460 

TAAGAAAGGT CAAGATTATA ACCTTCTAAA CGGCATAAGT GCATTTGATA AAGAAGATGG 8520 

AGATTTAACC GATAAAATTA AAGTCGATGG CCAAATTGAT ACATCTAAAT CTGGTAAATA 8580 

20 TCAAATTAAA TATCATGTCA CTGATTCAGA TGGTGCAATT AAAATTTCCA CTAGGTATAT 8640 

TGAGGTTAAA TAGCCCTCAT CACTATACTG CAAATAAAAT GGTAGCAAAC GAACATGTTT 8700 

TGCTACCATT TTATTTGTTA TTCTAACTTC ATCTGCAACT TTAACCCAAA TATTGTATTT 8760 

25 TTTCTGTATA CCAAAGGACT ACCTATCAAA TTATTAAAAC TTAACTGCTC TTTTTAAAAA 8820 

AATGTTTTGA TTTTGAACAA ACAAATTTCC ACTTTTCATT GTTTAACGAT AAATTACTTT 8880 

TGGCAAATTC CTTATTAAAA TGTTTGCGCT TCCTTTCAAT CAACTAGCCA TCATTTTCAA 894 0 

TTTATTAGAC AATTTCAAAC TTTTTTTATT TTCATTCAAT TAACCTTTAA TTGAAAGCTA 9000 

TTCTCAACTT TC I TIT £ AAA TATGAAGCAA TTTTTTCAAA AACGCTATTA GTCACAAAAT 9060 

GT " 9062 
<2) INFORMATION FOR SEQ ID NO: 86: 

7 ( i ) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 2738 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

45 (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 86: 

AAATATTTTT TCAAAACTAT GTGAAAATGG aCCATGTCtA aATCATGTAA TAATG CAGy A 60 

CATAATGCCA ACGGTCTmTC TTTATTGTCC CATGCATCAT GACCAATAAA TGACTCATCA 120 

50 ATTAATCGTC TAACTATTTC ATACACACCT AAAGAATGTC CAAAGCGACT ATGTTCTGCT 180 

GTGTGAAAAG ATAGGTACAG TGTTCCTAGT TGTCTAATTC GACGTAACCT TTGGAATTCC 240 
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30 



35 
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TCTTTAAAAA CTTTTTCTTC TACTAATTTT AAATCTACAT ATGCGTTAGT CATTATTCCC 
CTCCTTTTCG TTTAATATAA TATTTAATTT ACTTAAAATG CTTTGTACAT AAGTG CTAAG 
TCTAACTTTT CGCCATACAT TTCTGGCTCA TAAGAGCGTA AGATTGTAAA ACCTTGCTCT 
TTATAGTAAG CTACTGCTTC TTCATTTTTA TTATCTACTT CTAAGTAAAC ACCTTCAAAT 
TTATCTTCAA AACGTGATAA TCCTTCATTT AACAATGCTG TACCATAACC TGTATGTTGC 
GATTCTGGTT TAACATAATG AGCTGATAAA TATAATTCTT CACCGTAAAT AAAGTTAGCA 
AAGCCAACGA TGTCATTACC TTCTTCAACG ACTAAGAATA ATTGTTCTTG AAGTCTTTTC 
TTTAAATGAT GTTCATTATA TGAAGCTt CT AACAAGTGAT TAACTGTTGT CGCAGCGTAT 
ATATTTAAGT ATGTATTAAA CCAAGCTTTA GTTGCGACAT CTCTAATTTG AACAACATCT 
TTTTCAGTTG CTTGTCTTAC CTTGAACATG ACTTTCTCCC CTTATTAACA AGTTTTAATA 
ACGGCATTAT ACCACAACTT GCTCAATACT TAATAAACAA TGATTGTCTA TTCAATTTAT 



360 
420 
480 
540 
600 
660 
720 
780 
840 
900 



ATATt TATAT TTTCCGTTAA AATTAAAAAT AAAAAATAAC GAAGCAAAAA AtCACTTCGT 
TTAGTATGAG GTATGTCTTA TTGCAATATA CTATTCCACT CAGTTGCACG TGCTAAGGCA 
25 TAGTTGTCTT TCATGATGTC AC CAGG CTTT TCAGCAGTTC CAATAATATA ACCATTTAAA 

GTGGCACCTA rAAAGTCTAA ACTATATTTC ATTTGCGTAA TTGCTGGTTG GCTTTTATTT 
TTGGACAATC TCCACCAACT AAAATAACTC TAAAATCCTT TTCGGCCATT TGTGCCTTAA 
AATTAGGATA TCGTTTATCT TGTAATGTTT CTGACCAATG TTCGATAAAT GCTTTCAATG 
GTGCTGAAAT GCTATACCAA TACACTGGTG ATGCAAAAAT AATTGTATCA CTAGCCAATA 
TTTTATCTAG AATCGGCAAA TAGTCATCGT CATATGAAGT AATAGTCTCT GCTGTATGTC 
TCACGTCACG TATCGGTTTA AA CTGATGTT GTGTCACGTC AATCCATTGA TACT CTAAAT 1500 
CTTGCAAAGC GAATTTTGTT AATTGTGCAG TATTACCGTT TGGTCTACTC CCACCAAACA 1560 
AAACAGTAAT CATTTTAGCC TAACCTCACT TTTGATTAAT AAATATCTGT GTTTTTCGTT 1620 



1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 



1680 
1740 



ACCTAATTAT ACTATCATAA GCTTTGCCTA CCGAATAGTA AAACGCTTAC AACTTTTATA 
TAAATTTGAC GAAATTTCGT CATG CCTTAT ATAACGTCGT TTGTGATACG GGGCTAATTC 

ATGATGAAAT TAGATACATA TATCACCATT AAATACAATT CATTTAGTCT TCAATCGGAA 1800 

ACAGTTCATC GATATATTGA ATCTCATCAT CTGATAAAAC GATATCTGCA GCTTTAATAT 1860 

TTTCAACGAC TTGTTCTGCA CGTTTTGCAC CAGGAATAAT CACATCGATA GCTGGTCTCG 1920 

SO TTAAATAAAA TGCTAATACA ATGTTCG CAA TTGAAGTTTG ATGTGCTGCA GCTATGCTTT 1980 

CCAAAGCTTT TACGCGACGC ACATTTTCTT CAAATACACC TGGTTTAAAA TCACGACGTG 204 0 
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5 



10 



15 



20 



30 



35 



40 



45 



GCTAATGGGA 


AATATGGAAT 


AAATGTGATT 


TGGTGATCAA 


CACAATATTG 


TAATACTGCC 


2160 


TCATTTTCGC 


GATGCAATAA 


ATTATATTCT 


AACTGTACAA 


CATCAACGTA 


ACCATCTTTA 


2220 


TTTGCTTCTT 


TAAGTTGATC 


TAATGTGAAA 


TTTGATACAC 


CAATTGCTTT 


AATCTTCCCT 


2280 


TGTTCCTTAA 


GCTCTTGTAA 


TGCTGCAACT 


GCTTGATCTT 


TCGGAGTGTT 


GTTATCCGGA 


2340 


AAATGAATAT 


AATATAAATC 


GATATAATCA 


GTTTGTAGAC 


GTTTCAAACT 


ATTCTCAACT 


2400 


TGTTGTTTTA 


AATATTCCGG 


TTGATTGTTC 


TGATGTACTT 


CTTGATTTTC 


ATCAAATTCA 


2460 


TGAGACCCTT 


TCGTAGCAAT 


TTTAATTTGC 


TCTCGCGGAT 


ATTCTTTAAC 


AACTTCTCCA 


2520 


ACCAATTCTT 


CTGATCGTTC 


TGGCCCATAA 


ATATATGCCG 


TATCTAATAA 


ATTAATACCA 


2580 


TGATTAATGG 


CTTGACGAAC 


AACATCTTTT 


CCTTGTTCTT 


CATCTAAGTT 


CGGATATAAA 


2640 


TTATGCCCAa 


CCTAtGCGTT 


CGTCCCAAGT 


GCGATTGGAA 


ACACTTCAAC 


ATCAGATTTA 


2700 


CCTAAGTTTA 


CAAATTGCTn 


CATTAGACCC 


AGCnCCTT 






2738 


(2) INFORMATION FOR SEQ ID NO: 87; 








(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 9425 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 








(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 87: 






GATTAGATGA 


TATTTAACGA 


AAATTAaGrT 


GmAATACTtG 


AATGTArGAa 


GTCTGATGTC 


60 


GAAAATAGCT 


ATTAAAATAG 


AGTAGACGTA 


ATG t AAATGA 


AAGCACCTAA 


AATAGAAAAA 


120 


TTTCAAAAAT 


AG CGTAATTA 


TTATAATAAA 


TAGACTGCCA 


ATAAAATGCA 


ATTTTTCACT 


180 


TATAACATTC 


TTCAAAAAAT 


AATAGCAAAA 


TTATGTAAAA 


AATATCTTGT 


CATGGCAAGA 


240 


TTGGCTGTGC 


TATAATCTAT 


CTTGTGCTTA 


AGAACGGCTC 


CTTGGTCAAG 


CGGTTAAGAC 


300 


ACCGCCCTTT 


CACGGCGGTA 


ACACGGGTTC 


GAGTCCCGTA 


GGAGTCACCA 


TTTTTTAGGT 


360 


CTCGTAGTGT 


AGCGGTTAAC 


ACGCCTGCCT 


GTCACGCAGG 


AGATCGCGGG 


TTCGATTCCC 


420 


GTCGAGACCG 


TACAAATGCC 


TATCCAAGAG 


GATAGGCATT 


TTTTTGCGTT 


TAATATTATA 


480 


TTAATAAAAG 


ATATATGGAC 


GAATGATAAT 


CATATTGATT 


TATCTGTTCG 


TCCATTTTCT 


540 


TTAAAATGTA 


TGAACCTCAA 


GTAACTTAGT 


GGTTGGATAT 


GAAAGATAAA 


CGTAGACAAT 


600 


AAAATCTTTA 


TTAGACGTAC 


AAACATATGC 


TACTGTCAAC 


ATATTTCTTC 


GTTGTGATAT 


660 


GCCACCAGTC 


CTCCATAACA 


TCAATTGTTA 


AAGTAACGAA 


TAACGAATAA 


TGATATTTAT 


720 
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GACCTCATCA TTGTGTTAAA TATCATTGTC ACAATCCGCC GTGAGAAACT AATAAAAAAT 
AGTAATATAT AAGTTTATAT TGGAAAATAG AATTAATAGC TTATAAATGG TAAATTATAT 
AATAGGTTAC TATACGTTAT AAGACGGAAA ATGCGCACAA TAACAAAAAT AGTAAGCGAC 
ATCCTGTGAT TTTTTACACA AACATAAACG ATAAAGAACA AAAAATGATA AAATAATATT 

AATGATTTAA GAAAAGAGGT TTATGCAAAT GGCTAGAAAA GTTGTTGTAG TTGATGATGA 1080 

AAAACCGATT GCTGATATTT TAGAATTTAA CTTAAAAAAA GAAGGATACG ATGTGTACTG 114 0 

TGCATACGAT GGTAATGATG CAGTCGACTT AATTTATGAA GAAGAACCAG ACATCGTATT 12 00 

ACTAGATATC ATGTTACCTG GTCGTGATGG TATGGAAGTA TGTCGTGAAG TGCGCAAAAA 12 60 

ATACGAAATG CCAATAATAA TGCTTACTGC TAAAGATTCA GAAATTGATA AAGTGCTTGG 1320 

TTTAGAACTA GGTGCAGATG ACTATGTAAC GAAACCGTTT AGTACGCGTG AATTAATCGC 13 80 

2G ACGTGTGAAA GCGAACTTAC GTCGTCATTA CTCACAACCA GCACAAGACA CTGGAAATGT 14 4 0 

AACGAATGAA ATCACAATTA AAGATATTGT GATTTATCCA GACGCATATT CTATTAAAAA 1500 

ACGTGGCGAA GATATTGAAT TAACACATCG TGAATTTGAA TTGTTCCATT ATTTATCAAA 1560 

2S ACATATGGGA CAAGTAATGA CACGTGAACA TTTATTACAA ACAGTATGGG GCTATGATTA 1620 

CTTTGGCGAT GTACGTACGG TCGATGTAAC GATTCGTCGT TTACGTGAAA AGATTGAAGA 16 80 

TGATCCGTCA CATCCTGAAT ATATTGTGAC GCGTAGAGGC GTTGGATATT TCCTCCAACA 1740 

30 ACATGAGTAG AGGTCGAAAC GAATGAAGTG GCTAAAACAA CTACAATCCC TTCATACTAA 18 00 

ATTTGTAATT GTTTATGTAT TACTGATTAT CATTGGTATG CAAATT AT CG GGTTATATTT I860 

TACAAATAAC CTTGAAAAAG AGCTGCTTGA TAATTTTAAG AAGAATATTA CGCAGTACGC 1920 

35 

GAAACAATTA GAAATTAGTA TTGAAAAAGT ATATGACGAA AAGGGCTCCG TAAATGCACA 1980 

AAAAGATATT CAAAATTTAT TAAGTGAGTA TGCCAACCGT CAAGAAATTG GAGAAATTCG 2040 

TTTTATAGAT AAAGACCAAA TTATTATTGC GACGACGAAG CAGTCTAACC GTAGTCTAAT 2100 

CAATCAAAAA GCGAATGATA GTTCTGTCCA AAAAGCACTA TCACTAGGAC AATCAAACGA 216 0 

TCATTTAATT TTAAAAGATT ATGGCGGTGG TAAGGACCGT GTCTGGGTAT ATAATATCCC 222 0 

45 AGTTAAAGTC GATAAAAAGG TAATTGGTAA TATTTATATC GAATCAAAAA TTAATGACGT 2280 

TTATAACCAA TTAAATAATA TAAATCAAAT ATTCATTGTT GGTACAGCTA TTTCATTATT 234 0 

AATgCACAGT CATCCTAGGA TTCTTTATAG CGCGAACGAT TACCAAACCA ATCACCGATA 24 00 

SO TGCGTAACCA GACGGTCGAA ATGTCCaGAG GTAACTATAC GCAACGTGTG AAGATTTATG 24 60 

GTAATGATGA AATTGGCGAA TTAGCTTTAG CATTTAATAA CTTGTCTAAA CGTGTACAAG 2520 
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GTGATGGTAT TATTGCAACA GACCGCCGTG GACGTATTCG TATCGTCAAT GATATGGCAC 2640 

TCAAGATGCT TGGTATGGCG AAAGAAGACA TCATCGGATA TTACATGTTA AGTGTATTAA 2700 

GTCTTGAAGA TGAATTTAAA CTGGAAGAAA TTCAAGAGAA TAATGATAGT TTCTTATTAG 2 760 

ATTTAAATGA AGAAGAAGGT CTAATCGCAC GTGTTAACTT TAGTACGATT GTGCAGGAAA 2 820 

CAGGATTTGT AACTGGTTAT ATCGCTGTGT TACATGACGT AACTGAACAA CAACAAGTTG 2880 

AACGTGAGCG TCGTGAATTT GTTGCCAATG TATCACATGA GTTACGTACA CCTTTAACTT 2 94 0 

CTATGAATAG TTACATTGAA GCACTTGAAG AAGGTGCATG GAAAGATGAG GAACTTGCGC 3000 

GACAATTTTT ATCTGTTACC CGTGAAGAAA CAGAACGAAT GATTCGACTG GTCAATGACT 3060 

TGCTACAGTT ATCTAAAATG GATAATGAGT CTGATCAAAT CAACAAAGAA ATTATCGACT 3120 

TTAACATGTT CATTAATAAA ATTATTAATC GACATGAAAT GTGTGCGAAA GATACAACAT 3180 

20 TTATTCGAGA TATTCCGAAA AAGACGATTT TCACAGAATT TGATCCTGAT AAAATGACGC 324 0 

AAGTATTTGA TAATGTCATT ACAAATG CG A TGAAATATTC TAGAGGCGAT AAACGTGTCG 3300 

AGTTC CACGT GAAACAAAAT CCACTTTATA ATCGAATGAC GATTCGTATT AAAGATAATG 3360 

25 GCATTGGTAT TCCTATCAAT AAAGTCGATA AGATATTCGA CCGATTCTAT CGTGTAGATA 3420 

AGG CACGT AC GCGTAAAATG GGTGGTACTG GATTAGGACT AGCCATTTCG AAAGAGATTG 34 8 0 

TGGAAGCGCA CAATGGTCGT ATTTGGGCAA ACAGTGTAGA AGGTCAAGGT ACATCTATCT 354 0 

TTATCACACT TCCATGTGAA GTCATTGAAG ACGGTGATTG GGATGAATAA TAAGGAGCAT 3600 

ATTAAATCTG TCATTTTAGC. ACTACTCGTC TTGATGAGTG TCGTATTGAC ATATATGGTA 3 660 

TGGAACTTTT CTCCTGATAT TGCAAATGTC GACAATACAG ATAGTAAGAA GAGTGAAACG 3720 

rAACCTTTAA CGACACCTAT GACAGCCAAA ATGGATACAA CTATTACGCC ATTTCAGATT 3 780 

ATTCATTCGA AAAATGATCA TCCAGAAGGA ACGATTGCGA CGGTATCTAA TGTGAATAAA 3 840 

CTGACGAAAC CTTTGAAAAA TAAAGAAGTG AAGTCCGTGG AACATGTTCG TCGTGATCAT 3 900 

AACTTGATGA TTCCTGATTT GAACAGTGAT TTTATATTAT TCGATTTTAC GTATGATTTA 3 960 

CCGTTATCAA CATATCTTGG TCAAGTACTG AACATGAATG CGAAAGTACC AAATCATTTC 4 020 

45 AATTTCAATC GTTTGGTCAT AGATCATGAT GCTGATGATA ATATCGTGCT TTATGCTATA 4 080 

AGCAAAGATC GCCACGATTA CGTAAAATTA ACAACTACAA CGAAAAATGA TCATTTTTTA 414 0 

GATGCATTAG CAGCAGTGAA AAAAGATATG CAACCATACA CAGATATCAT CACAAACAAA 4 200 

50 GATACAATTG ATCGTACGAC GCATGTTTTT GCACCAAGTA AACCTGAAAA GTTAAAAACA 4 260 

TATCGCATGG TATTTAACAC GATTAGTGTT GAGAAAATGA ATGCTATACT ATTTGACGAT 4 3 20 
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GCAAACTATA ACGATAAAAA TGAAAAATAT CATTATAAAA ACCTGTCCGA AGATGAAGCG 4440 
AGTTCCAGCA AAATGGAAGA AACGATTCCA GGAACCTTTG ATTTTATTAA TGGTCATGGT - 4500 

GGTTTCTTAA ACGAAGACTT TAGATTGTTT AGTACGAATA ATCAGTCAGG CGAGTTAACA 4560 

TATCaACGTT TCCtTAATGG TTATCCAACG TTTAATAAAG AAGGTTCTAA TCAAATTCAA 4620 

GTCACTT GGG GTGAAAAAGG CGTCTTTGAC TATCGTCGTT CGTTATTACG CACCGACGTT 466 0 

GTTTTAAATA GTGAGGATAA TAAATCGTTG CCGAAATTAG AGTCTGTACG TTCAAGCTTA 474 0 

GCGAACAATA GTGATATTAA TTTTGAAAAA GTAACAAACA TCGCTATCGG TTACGAAATG 4800 

CAGGATAATT CAGATCATAA TCACATTGAA GTGCAGATTA ACAGTGAACT CGTACCGCGT 4860 

TGGTATGTAG AATATGATGG CGAATGGTAT GTTTATAACG ATGGGaGGCT TGaATAAATG 492 0 

AACTGGaAAC TGACAAAGAC ACTTTTCATT TTCGTGTTTA TTCTTGTCAA CATCGTGTTA 4 980 

GTATCGATTT ATGTTAATAA AGTCAATCGC TCACACATTA ATGAAGTCGA GAGTAACAAT 504 0 

GAAGTTAATT TTCAGCAAGA AGAAATTAAA GTACCGACTA GTATATTGAA TAAATCAGTT 5100 

AAAGGTATAA AATTAGAGCA AATTACAGGG CGATCAAAAG ACTTTAGTTC TAAAGCTAAA 5160 

25 GGCGATTCGG ATTTGACCAC ATCAGATGGT GGAAAATTAT TGAATGCGAA CATTAGTCAA 522 0 

TCGGTAAAGG TCAGTGACAA TAACTTAAAA GATTTGAAAG ATTATGTTAA CAAGCGCGTA 52 8 0 

TTTAAAGGTG CTGAATATCA ATTAAGCGAG ATTAGTTCAG ATTCTGTAAA ATATGAACAA 534 0 

ACGTATGATG ATTTTCCGAT TTTAAATAAC AGTAAAGCGA TGTTAAACTT TAATATAGAA 54 00 

GATAACAAAG CGACTAGTTA TAAACAATCA ATGATGGATG ACATTAAGCC CACAGATGGT 54 6 0 

G CAGAT AAGA AGCATCAAGT GATTGGTGTG AGAAAAGCAA TCGAGGCATT ATATTATAAT 552 0 

CGTTACTTGA AAAAAGGTGA TGAAGTCATT AATGCTAGAC TCGGTTACTA CTCAGTCGTG 5580 

AATGAAACGA ATGTTCAATT GTTACAACCA AACTGGGAAA TTAAAGTGAA GCATGACGGT 564 0 

^GGATAAAA _CGAATACTTA „ CTATGTCGAA _GCGACAAATA. ATAACCCTAA AATTATTAAT . 570 0 

CATTAATATG AATCGTAATA AGCTAGCATT GCAAGCTCAT CATATGTGAG AAGCGGTGCT 5760 

AGCTTTTTTG CTGGTACGGT TTATTATGGC TGATGTTTTT GCGTCTCCAA CGTGCGCATT 582 0 

TATTCATATT TTAAGTAGAA CCGCATTGTA AAATTAGTGT AACTGTTATT TTAAAAACTT 5880 

TAGTATTTGT CTAATCATTG TTATAATAAT TAAGAAATTC ATTGCACGTG ATTATCAAAA 594 0 

TTTAAATATA AGAAACCGGT CGATGAACTA AAGTTACATA ATAGGAAAGG TATACAAAAC 6000 

SO AGCTAATATA CTGATAGTTT CTGTAGGGAA AATCGTATAT TTGCACTGAT GTATATTGCA 6060 

GTCATATAGA GAGATTGACT GTTTAAAGAG AAAGGATGAG CCGCTTGATA CGCATGAGTG 6120 
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TAGTTGATGT TGOTTTGACT GGAAAGAAAA TGGAAGAATT GTTTAGTCAA ATTGACCGTA 624 0 

ATATTCAAGA TTTAAATGGT ATTTTAGTAA CCCATGAACA TATTGATCAT ATTAAAGGAT 6300 

TAGGTGTTTT GGCGCGTAAA TATCAATTGC CAATTTATGC GAATGAAAAA ACTTGGCAGG 6 360 

CAATTGAAAA GAAAGATAGT CGCATCCCTA TGGATCAGAA ATTCATTTTT AATCCTTATG 6420 

AAACAAAATC TATTGCAGGT TTCGATGTTG AATCGTTTAA CGTGTCACAT GATGCAATAG 64 80 

ATCCG CAATT TTATATTTTC CATAATAACT ATAAGAAGTT TACGATTTTA ACGGATACGG 6 54 0 

GTTACGTGTC TGATCGTATG AAAGGTATGA TACGTGGCAG CGATGCGTTT ATTTTTGAGA 6600 

GTAATCATGA CGTCGATATG TTGAGAATGT GTCGTTATCC ATGGAAGACG AAACAACGTA 6660 

TTTTAGGCGA TATGGGTCAT GTATCTAATG AGGATGCGGC TCATGCAATG ACAGACGTGA 6720 

TTACAGGTAA CACGAAACGT ATTTACCTAT CGCATTTATC ACAAGACAAT AACATGAAAG 6780 

ATTTGGCGCG TATGAGTGTT GGCCAAGTAT TGAACGAACA CGATATTGAT ACGGAAAAAG 6840 

AAGTATTGCT ATGTGATACG GATAAAGCTA TTCCAACGCC AATATATACA ATATAAATGA 6900 

GAGTCATCCG ATAAAGTTCC GCATTGCTGT GAGACGACTT TATCGGGTGC TTTTTTATGT 6 960 

TGTTGGTGGG AAATGGCTGT TGTTGAGTTG AATCGGCTTG ATTGAAATGT GTAAAATAAT 7020 

TCGATATTAA ATGTAATTTA TAAATAATTT ACATAAAATC AATCATTTTA ATATAAGGAT 7080 

TATGATAATA TATTGGTGTA TGACAGTTAA TGGAGGGAAC GAAATGAAAG CTTTATTACT 7140 

TAAAACAAGT GTATGGCTCG TTTTGCTTTT TAGTGTAATG GGATTATGGC AAGTCTCGAA 7200 

CGCGGCTGAG CAGCATACAC CAATGAAAGC ACATGCAGTA ACAACGATAG ACAAAGCAAC 7260 

AACAGATAAG CAACAAGTAC CGCCAACAAA GGAAGCGGCT CATCATTCTG GCAAAGAAGC 7320 

GGCAACCAAC GTATCAGCAT CAGCGCAGGG AACAGCTGAT GATACAAACA GCAAAGTAAC 7380 

ATCC&ACGCA CCATCTAACA AACCATCTAC AGTAGTTTCA ACAAAAGTAA ACGAAACACG 7440 

CGACGTAGAT ACACAACAAG CCTCAACACA AAAACCAACT CACACAGCAA CGTTCAAATT 7500 

ATCAAATGCT AAAACAGCAT CA C TT T CACC ACGAATGTTT GCTGCTAATG CACCACAAAC 7560 

AACAACACAT AAAATATTAC ATACAAATGA TATCCATGGC CGACTAGCCG AAGAAAAAGG 7620 

GCGTGTCATC GGTATGGCTA AATTAAAAAC AGTAAAAGAA CAAGAAAAGC CTGATTTAAT 7680 

GTTAGACGCA GGAGACGCCT TCCAAGGTTT ACCACTTTCA AACCAGTCTA AAGGTGAAGA 774 0 

AATGGCTAAA GCAATGAATG CAGTAGGTTA TGATGCTATG GCAGTCGGTA ACCATGAATT 7800 

TGACTTTGGA TACGATCAGT TGAAAAAGTT AGAGGGTATG TTAGACTTCC CGATGCTAAG 7 860 

TAcTAACGTT TATAAAGATG GAAAACGCGC GTTTAAGCCT TCAACGATTG TAACAAAAAA 7 92 0 
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TGAAGGCATT AAAGGCGTTG AATTTAGAGA TCCATTACAA 
GCGTATTTAT AAAGACGTAG ATACATTTGT TGTTATATCA 
AACACAAGAA ACATGGCGTG GTGATTACTT AGTGAAACAA 
GAAGAAACGT ATTACAGTTA TTGATGGTCA TTCACATACA 
TTATAACAAT GATGCATTGG CACAAACAGG TACAGCACTT 
ATTTAATTAT CGCAATGGAG AGGTATCGAA TATTAAACCG 
CGTTGAAAAT GTAACACCGA ACAAAGCATT AGCTGAACAA 
ATTTAGAGCA CAAACTGCAG AGGTAATTAT TCCAAACAAT 
AAGAGATGAC GTTAGAACGC GTGAAACAAA TTTAGGAAAC 
AGCGTATGGC GTTAAGAATT TCTCTAAAAA GACTGACTTT 
TATTCGTGCC TCTATCGCAA AAGGTAAGGT GACACGCTAT 
ATTTGGAAAT ACGATTGCGC AAATTGATGT AAAAGGTTCA 
ACATAGTTTA GGCG CAC CAA CAACACAAAA GGACGGTAAG 
CGGTTTACTA CATATCTCTG ATTCAATCCG TGTTTACTAT 
CAAACGAATT AATGCTATTC AAATTTTAAA TAAAGAGACA 
TTTAAAACGT GTATATCACG TAACGATGAA TGACTTCACA 
TAGTATGTTC GGTGGTCCTA GAGAAGAAGG TATTTCATTA 
TTTAAAAACA GCTAACTTAG CTAAGTATGA TACGACAGAA 
TAAACCAGCA GTAAGTGAAC AACCAGCTAA AGGACAACAA 
TGGTAAAGAT ACACAACCAA TTGGTGACGA CAAAGTGATG 
TCCAGGTAAA GTTGTATTGT TgtAGCGCAT AGAGGAACTG 
TCTGGTCGCA CAATAGAAGG AGCTACTGTA TCAAarAAr:* 
ATGTCAGTGC CTAAAGGTAG CGCGCATGAG AAACAGTTAT 
ACGTAGCTAA GTAATGATAA ATAATCATAA ATAAAATTAC 
AAATA 

(2) INFORMATION FOR SEQ ID NO: 88: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3886 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
<D> TOPOLOGY; linear 



AGTGTGACAG 
CATTTAGGAA 
TTAAGTCAAA 
GTACTTCAAA 
GCGAATATCG 
TCATTGATTA 
ATTAATCAAG 
ACCATTGATT 
GCGATTGCAG 
GCCGTGACAA 
GATTTAATCT 
GACGTCTGGA 
ACAGTGTTAA 
GATATAAATA 
GGTAAGTTTG 
GCATCAGGTG 
GATCAAGTAC 
CCACAACGTA 
GGTAGCAAAG 
GATCCAGCGA 
TTAGTAGCGG 
GTGGGAAACA 
TTCATAATCA 
AGATATTGAC 



CGGAAATGAT 
TTGATCCTTC 
ATCCACAATT 
ATGGTCAAAT 
GTAAGATTAC 
ATGTTAAAGA 
CTGATCAAAC 
TCAAAGGAGA 
ATGCTATGGA 
ATGGTGGAGG 
CAGTATTACC 
CGGCTTTCGA 
CAGCGAATGG 
AACCGTCTGG 
AAAATATTGA 
GCGACGGATA 
TAGCAAGTTA 
TGTTATTAGG 
GTAGTAAGTC 
AAAAACCAGC 
TACAGAAGGT 
ATTGGGTAGA 
ACAGTCATTG 
AAAAAATAGT 



8040 
8100 
8160 
8220 
8280 
8340 
8400 
8460 
8520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
-9300 — 
9360 
9420 
9425 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 88: 

AGTTGTAATG TCACATTTCC AGAGTCTGAA ATTATCTTTA TCACGTTACA TTTACTAGGC €0 

5 TCTAAAATGA CTGAACATAC AGCATCTTCA ATTACCTTTG AATACCATGA TTTATCGCAA 120 

AATATACATG AATTGATCAC TTGTGTTAGC CAAGAATTAG GCATTGATAT GTCAAAAGAC 180 

AACAAGTTAC ATACCAGTCT GATCACACAT ATCAAACCAG CTATACATCG TATTAAATAC 240 

10 

GATATGCTAC AACCTAATCC TTTGAGGCAA GAAGTTATGC GTCG CTATCC TCAAATCATT 300 

GAAGC CGTTA GCAAG CATAT TAGTCCAATT GAACAAGATG CTGCTATTCG CTTCAACGAA 360 

GATGAATTAA CATACATTAC AATTCACTTC GCATCAAGTA TAGAGCGTGT TGCAACACAT 4 20 

15 

AAACAATCAA TGATTAAGGT TGTCTTACTA TGTGGTTCTG GTATAGGCAC GTCACAACTT 4 80 

TTAAAATCAA AACTAAATCA CCTGTATCCT GaGTTnCACA TTTGGGAtGc CTATTcCATT 540 

TaTcAATTGG aAGaAAGTCG ATTATTGCAA GATAACATTG ATTATGT CAT TTCAACAGTA 6 00 

20 

CCTTGTGAAA TATCAGCTGT ACCAGTTATT CATGTCGATC CATTTATCAA TCAACAATCT 660 

CGTCAAAAAT TGAATCAAAT TATCAATGAC TCAAGAGAAC AACGAGTCAT GAAAATGGCA 720 

25 ACTGATGGCA AGTCACTCGC AGATTTATTG CCTGAACATC GCATCATTAf AAATAAACAA 780 

CCATTATCAA TTGAATCCGC AATTGCAGTG GCTGTGCAAC CTTTAATCAA TGATGGCATT 840 

GTCTATTCAA ATTATACAGC TGCAATTTTA AAACAATTTG AACAATTCGG GTCATATATG 900 

30 GTCATTAGTC CACATATTGC ACTTATTCAC GCTGGTACTG ATTATGTACA GAATGGTGTA 960 

GGTTTCGCAC TAACATATTT CACTGAAGGG ATTATCTTTG GTAGTAAAGC TAACGATCCC 1020 

GTTCACCTTG TAATTACATT AGCAACGGAC CACCCCAATG CACATTTAAA GGCATTGGGA 1080 

35 CAGTTAAGCG AATGCTTAAG CAACGACTTA TATCGACAAG ATTTCTTAGA TGGGAATATT 1140 

TTT^AATTA AACAACACAT TGCTTTAACT ATGACAAAGG AGGCTTAATA ACGTGTCATT 1200 

AGACATTTTG TCAACAACAC GCATCATTGT AAAAGAACAA GTAAATGATT GGACTGAAGC 1260 

40 

TATAACTATA GCTTCTCAGC CATTACTACA AGAACAAATT ATTGAACAAG GCTATGTTCA 1320 

AGCAATGATT GATAG CGTTA ATGAACTTGG ACCTTATATC GTTATCGCAC CTGAAATTGC 13 80 

AATTGCACAT GCAAGACCGA ACAATGACGT ACATCAAGTT GGTTTAAGTC TATTAAAGTT 144 0 

45 

GAATCAACAT GTGGCATTTT GTGATGAAGA TCACTACGCA TCTCTCATTT TTGTATTGAG 1500 

TGCCATCGAC AATCATTCAC ACTTATCTGT ATTACAAAAT TTAGCAACCG TACTGGGCGA 156 0 

so TAACCAAACA GTCCAGCAAC TATTAACTGC AACAAATGCA CAAGACATTA AAAACATTTT 1620 

AAAGGAGCAT GATTAATATG AAAATTTTAG TAGTATGTGG CCACGGTTTA GGAAGTAGTT 1680 
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AAGTTGAACA TAGTGACATT ATGACAGCAA GTCCAGAGAT GGCTGACTTG TTTATTTGTG 
GTAGAGATTT AGCTGAAAAT GCCGAACGTC TAGGGGATGT CTTAGTTCTT GATAATATTT 
TAGATAAAGC TGAATTACAA CAAAAGCTCT CAGAAAAATT ACAACAACTT AACATGATTT 
AAAGGAGGTA CGACCTATGC AAGCAATCCT TAATTTTATA GTCGATATTT TAAGTCAACC 



1800 
1860 
1920 
1980 

AGCCATTCTT GTTGCACTGA TTGCCTTTAT AGGTTTAATC GTTCAGAAAA AACCTGCCGC 



, 0 iinnit uiiut^iuuw AACCTGCCGC 2040 

AACGATCACT TCAGGAACCA TTAAAACGAT ATTAGGCTTC TTAATTTTAA GTGCAGGTGC 2100 

TGATGTOGTC GTTCGATCTC TTGAACCATT CGGCAAAATA TTCCAACACG CATTTGGTGT 2160 

is GCAAGGTATC GTACCTAACA ACGAAGCTAT CGTCTCACTA GCCTTAAAAG ATTTTGGAAC 2220 

AACAGCTGCA CTCATCATGG TCTGTGGCAT GATTGTTAAT ATTTTAATTG CCCGCTTCAC 2280 

TAATTTAAAA TATATCTTTT TAACAGGTCA TCATACATTT TACATCGCTG CGTTTTTAGC 2340 

20 AATCATTTTA ACAGTCAGTC ATATTAAAGG CTGGCTAACG ATTGTTATCG GCGCACTCGT 24 00 

ATTAGGATTA ATCATGGCAG TATTACCTGC ATTACTCCAA CCTACGATGC GAAAAATTAC 2460 

AGGGAATGAC CAAGTAGCTT TAGGTCATTT TGGCTCAATC AGTTACTTTG CCGCAGTGCT 2520 

GTAGGTCAAT TATTCAAAGG TAAGTCTAAA TCAACGGAAG AGATTAAATT TCCAAAAGGC 2580 

TTAAGTTTCT TACGAGAAAG TACAATTAGT ATCTCGATTA CGATGGCATT ACTTTACTTC 2640 

ATCGCATGCT TATTTGCGGG CGTTAGTTAT GTACACGAAT GTATTAGTGA TGGTCAAAAC 2700 

TTTATTGTcT TTTCATTAAT TCAAGGTGTG ACATTTGCTG CTGGTGTATT TATTATTTTA 2760 

ACGGGCGTTC GTTTAATCTT AGCTGAAATC GTCCCAGCAT TTAAAGGAAT TTCTGAAAAG 2820 

^ CTTGTACCAA ATTCTAAACC TGCATTAGAC TGCCCTATTG TGTTCCCTTA TGCACAAAAT 2880 

GCAGTATTAA TTGGATTCTT TGTCAGCTTT ATTACAGGTG TCATCGGTAT GTTTATCTTA 2940 
TTCTTATTTG GTGGCGTCGT CATTTTACCT GGCGTAGTTG CACACTTCTT CTTAGGTGCA 

40 ACGGCTGCTG TATTCGGTAA TGCAAGAGGC GGTATTAAAG GTGCTATTGc TGGCGGCGGT 

CTAAATGGTA TCCTAATCAC GTTTTTACCA TTATTATTCT TGCCATTTTT AGGCGAATTA 
GGTGGTGCTG caacaacatt ctcagataca gactttttag CTGTCGGTAT CGTGTTCGGT 

4S AACGCAGTAA AATATATGGG ATTATTTGGT GCGATTCTAT TTATTATTAT CGTAGGTGCG 

ACAACAATTT TATTAAAAGG CCGTCAAAAA GAACAGCAAT AGTGTTAACG TAGAAATATA 
AAACACCGTC A CAT ATTGAG TGAATGCCCC TTTtATCAAG AGGAAAGCCA CTTACTTATG 
GACGGTGTTT TGTATTATAT TAAATGATAC TTAGCCATAC TATCGACAGC TGCTAAAATT 
GCTTCTTCTT GTGTCGCAAT CGGTTCCCAA CCAAGTAATG TTTTTgCACG TTCGTTACTT 
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CCTAGACTCA AAATAAAGTC TGGTAATTTT TTAGTAGAAA CTTTTTGAGC TATTTCAGGT 3600 

CTCTTTTCTT TAATTAATTT TGCAATTTCC AACAAATTAA TTTGTCCATC AGCCGTCGCA 3660 

5 ATAAATCGCT TGCCATTAGC TTGTTCATTT GTCATTGCCA AAATGTGCAG TTCAGCTACG 3720 

TCTCTCACAT CAACAACATT TAACGGAATT TGCGGTACAC GTTTCATTGA ACCATTCAAT 3780 

AAATTTTCTA ATAAATGAAA GCTTCCTGAA ACGTGTGCAT CTAATGATGG CCCAAAAATT 3840 

70 

GCAACTGGAT TGATTGTGGC AAATTCTACT GTTGTATTTT CATTCT 38 86 

(2) INFORMATION FOR SEQ ID NO: 89: 

(i) SEQUENCE CHARACTERISTICS: 
15 (A) LENGTH: 4 879 base pairs 

<B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

20 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 89: 
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GTCATCTATC 


AAAAATTTGG 


TATACAGACC 


GACAATTATT 


AATTAATAAT 


TTAATTTCCC 


60 


AGGCAATACC 


AGTGATTAAA 


TATCCACAAA 


TACAACATAA 


AGAACAACCA 


TTAGAATCTA 


120 


TTTCACAACT 


TATATTGTCT 


AAGATGACAT 


CTAATCAATA 


GTGTTTAAAT 


TTCTCAGTGG 


180 


CTGTGAATGA 


GGTTTAAAAG 


TACTATAAAA 


CGTAAACTTT 


GATACTTTAA 


AATACGCAAA 


240 


AAACGGTAAA 


CCCTAATTCA 


TATTATAGAG 


TTTACCGTTT 


TATTTTTTAA 


CTTG CAT CAT 


300 


AGTTATATTA 


ACATTATTGT 


TGGTAGTTTG 


GATCAGTAAC 


CATTGCTTGT 


CCAGTATAAT 


360 


CAACCGTTAC 


AATTGAATAT 


TTTCCaTTTG 


CATTTGGGTC 


TTTAAAACTA 


AACACATACT 


420 


TATAGTTGCC 


ATTATGTTCT 


TCAATAGAAT 


AATCATTATA 


CACTTTATTA 


TTACTACCAA 


480 


ATTT&TTTGC 


TT CATTATT A 


GCCGCATTTA 


AAGCTGTTTG 


GAAATTTGGC 


AATTGCTGTA 


S40 


AAGCTTGATT 


TTTATTTCCA 


TTAAACGGAT 


AAATTTGACG 


TGCAACCGGC 


GCGGCATTTT 


600 


GnCCATAATA 


TGGTGCAACG 


TAACTTGATT 


TTTGATTATT 


ATTCGCTTGG 


TT ATT ACTTG . 


660 


ATTGGTTATT 


ATTTGTTTGG 


TTTTGGTCAT 


TGTTTGTTGC 


ATTTGAATTA 


GATTGTTGCT 


720 


GGTTATCGTT 


TGCACTATTA 


TCTTTATTAT 


CTTTGTTTAC 


GTCTTTACTA 


TCATCTTTAT 


780 


TATCTTTCTT 


ATCTTTAGAT 


GAATCATTTG 


rrrrriTATC 


TTGTTGTTCA 


GTTTTCGCTT 


840 


TATCATCTTT 


TTCTTTATTA 


CCGTCTTTTT 


GTTGGTCACT 


ATCTTGACCA 


CATGCAGCTA 


900 


AAAATAATGA 


TAATGCTAGT 


AACCCTGTAA 


CTAATCTTTT 


CATACATATC 


TCCTCCTATA 


960 


ATTCGATATT 


CATTGAATAA 


TCTTGAAATA 


CATATCTACC 


ATGTGTATCT 


TTTCATGGCT 


1020 
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TAAGGTTCTT TTTATTATAC CCTAATTTTT GTTCATTATT ATTTAATTTT TGTGAATTTT 
ATGtTTkCTA TAAATTTAAT TATTTTACTT TAACAATTCA TTACGCATTT AGCATTTCAA 
GGTATACACA ATATTTATTA CTATGATTTC ATTTTATCTG CTGCAAAAAC AATCATTATA 
ACTCTTTTTC CATAATTAAA TCTGTATCCG TTACATCACC TGTTTGAAAA TGATGTTCAC 

CAACCACTTT AAATCCATGA CGTTTATAAA ATGCTTGAGC ACGAGGATTA TGCTCCCAAA 13 80 

CTCCTAGCCA AATTTTATGT TTATTATGTT CTTGAGCAAT TTTTTCGGCC AATTCTATCA 144 0 

ATTGTGAACC TCTTCCGCCA CCTTGAAAGT CTTTCAAAAA AT AT ATG CG C TGCACTTCTA 1500 

AATAGGTCTC CCCCATTTCT TCAGTTTGAG CACTATTAAT ATTCATCTTT ATATAACCAA 1560 

CATTCGCACC ATCTTCTTGa TAAAAATAAT GAAATGAATC TACATGGTTA ATCTCTTGTG 1620 

TAAATTTCTC TACAGTATAA TTGTCTTTAA AAAATTGATC AAAATCTTTG TCATCATAGT 1680 

20 AAGAACCAAA CGTGTCATAA AATGTTCTAG TTGCTAATTC AACTAATTCA CTAGCATTTT 1740 

GTTCTGAAAT TTCTTTGATT ATCCCAGCCA TATAAATCCT CCAATAAACA GTGATCGAAT 1800 

CAAAATATTA CTTATGTTAT TTTTCAGCCA AAACTATTTA AAAATACATT AACACAAATC 1860 

25 AATTACAAAT TGTATTGATT GTGTGTAACA TCAATAAATG ATACATTTAT TCCAGTAAAA 1920 

TGG CCGTATT TTCAAAAGAG AAAAAGAGAG GATGTATCGT TGTGATAGAA ACATTTAAAG 1980 

CGTTTGTAAT TGATAAAGAT GAGAGTGGTA AAGTGACACC AACTTTCAAA CAATTAT CGC 204 0 

CTACTGATTT ACCTAAAGGA GATGTGCTGA TTAAAGTACA TTACTCTGGT ATAAATTATA 2100 

AAGATGCTTT AGCGACTCAA GATCATAATG CAGTCGTAAA ATCGTATCCT ATGATTCCAG 2160 

GAATAGATTT AGCTGGAACA ATTGTTGAAT cCGAAGCACC AGGCTTTGAa AAAGGAGAAC 2220 

AAGTAATTGT AACGAGTTAT GACCTAGGTG TCAGCCATTA TGGCGGTTTT AGTGAATATG 2280 

CGCGTGTAAA ATCAGAATGG ATTATCAAGC TTCCTGATAC TTTAACATTA GAAGAATCAA 2340 

TGATATATGG CACAGCTGGT TATACTGCCG GTTTAGCAAT TGAAAGACTT GAAAAAGTTG 2400 

GAATGAATAT TGAAGATGGT CCTGTACTCG TTCGCGGTGC TTCAGGTGGT GTCGGTACTT 24 60 

TAG CAGTACT CATGCTTAAT GAACTTGGTT ATAAAGTTAT CGCAAGTACA GGTAAACAAG 2520 

45 ATGTTAGCGA TCAATTACTT GAACTTGGTG CCAAAGAAGT TATCGATCGA CTTCCTGTTG 2580 

AAGATGATCA TAAAAAGCCA CTCGCATCAT CAACTTGGCA AGCTTGTGTA GACCCTGTTG 2640 

GTGGCGAAGG TATTAATTAT GTTACAAAGC GTTTAAATCA TAGTGGGTCA ATTACAGTTA 2700 

SO TTGGTATGAC TGCCGGTAAT ACTTATACTA ATTCTGTATT CCCTCACATT TTAAGAGGTG 2760 

TAAACATTTT AGGAATTGAC TCGGTATTTA CTGCTATGAA ATTAAGACAG CGCGTTTGGC 2820 
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TTGATGAACT TCCAGAACAA CTTAACAAAG TAATTAAACA TGAAAATAAA GGGCGCATTG 2 940 

TTATCGATTT CGGTGTAGAT AAATAGTATT CATGAAAAAG ACATCCCGTT ATGCGAGATG 3 000 

TCTTTTTTAA TTTAGTATTT GATATACATA CCGCCTGAAT CTGGTTCGGT AGGTATAAAT 3 060 

CCAAATTTTG TATATAATTT ATCCGCTGGG TAGTCTGCAA TCAGAcTAAC GTATGTACTC 3120 

TCAACAGCCA CACCTTTAAT ATATTGCATA ATATGCTCCA TAATTAGACT GCCGTAACCT 3180 

TGACCTTGGT AACTTTTCAA AACTGCAATA TCAACAATTT GAAAAACAGT TCCGCCATCG 3 240 

CCAATCACTC TACCCATACC AATTAACCGA TCTTTATCAT ACAAGGTTAC TGTAAATAAG 3 3 00 

GCATTAGGTA ATCCTTTTTC aGCTGTTCGC GCGTCTTTGG ACTCATACCT GCGTTAATCC 3 360 

TTAATGCGCA ATAATCCTCG CAAGTCGGAA TATCATATGT CACTTTAACC ATTATTTACC 3420 

CCACTTTTCA TCACACAATA TATCAACCTA GTATAAATGT TTATTTACAA TAGTCTTATT 3480 

CGCTTCTTTA AACACTTCAT GATGACTTGA AACATAACCC TCTGCATTCG CATCTGGTTG 354 0 

GATATATGTT TTAGCAAGGT TCGCTGCATT TGCACCATCA CTAAATGCAC TTGCAATTAG 3600 

ATGTGATTTT G CATCATGAT AAACAATATC TCCACACGCA T AGAT AC CAG GTATACTAGT 3 660 

25 TGTCGTATTA CCAAATCCTT TAACACGACA ATCATCATGC ATATCTAGCT TTGAAGATGT 3720 

TtCACTCAAT AATGTATTAC AACGATCAAA CCCATGACTA ATAATGACAT CGTCAAATTT 3780 

AACTGTATGC CTATCGCCAC TTTCAACATG TTCCAAAACA ACTTCACTTA TATGCGTTTC 3840 

30 ATCATCATTG CCGACCAAGT ATTTAATACG TGTTTTTGGG CATAGTTTCA CATTTAAATC 3 900 

TGTCACCAAC GTTTTCATCG CTTCATGACC ACTTACATCT TCTTTTCGAT AAACAACTGT 3 96 0 
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CACGCTTTTA GCAATCTTGG CAAT AT CATG CGCCCAATCT AATGCTGTAT TTCCTCCACC 4 020 

TGATATTAAT ACATCTTTAT CTTTGAAACG TCTGTAACTT TGTACAACAT AATGTAAATT 4080 

AGTTfiATTGA TATCTCTCTA CACCTTTAAC ATCTAATTGT TTTGGATTAA TAATACCCGC 414 0 

ACCAATTGCA ATGATAACTG CTTTCGATGT ATATATTTCT CCCGCTTCTG TTTCAACTTC 4200 

GAAATGACGT TCTGCCTTTT TCCTAATATC TAC CACACGT TCATTCAAAT GAACTTCCGG 4260 

TTTAAAATAT AATCCTTGCT TAATTGTATC TTTTAAAATT TCATGACAAG GTTTTGGCGC 4320 

AATGCCGCCA ATATCCCAAA TAATTTTTTC AGGGTAAATT CTCATCTTAC CCCCTAATTC 4380 

AGATTGAACA TCTATCAATC TTACAGACAT ATCTCGCAAT CCAGCATAAA AGCTTGCATA 4 44 0 

CAAACCAGAC GGACCGCCAC CAATGATTGT AACATCTTTC ATT ATGTGC C TC CTATG ACT 450 0 

CT CT AT ATTC ATTTCTTTCA TTAACGTGCT CAAATTGATA ATTATTATCA TTTAAAGCCA 4 560 

TTATACTATT AATATTTATA TTGTTAAAAT AAATCGCATA GTTAGCCATG AATTATCAAT 4620 
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GAAAGATGTG TATATTTTTT AGTTCTAGTT ATATTATTTT TTAAAAGACT CATCACGTGG 
TTCTTTAAGA ATTGCTTGTC TTAAAAGGAA AAATAGCAAC AATAAACCTG CAAGCATACC 
TGTGTGCCCA ATACCTGCAA AGCCTGCnAA TGCTTCTGGA GAGTATGATT TACCAGTGAC 
TTGGAAGAAT CCTTTTGTC 

(2) INFORMATION FOR SEQ ID NO: 90: 

(i) SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 1560 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 90: 
ATAATGTCTT AGaTTGATTG GGAGTTTTTT TAATTTTTTT GAAATTAAAT TAATCTGTAs 
yTAATAAAAA ATTTGAATAA CTGACACAyT TTTTTGATCA TAGCTAyATA CTTTGTGAAT 
TAATTCACAT TATAATAAGA GTGAAGATAA GAGTATTATA AATnATCTTT AAATAAATAT 
ATGTGAAGTA AAAATTACAC GTTAGCATAT CGATTATGgT CATTTCkTTT AACATATTAA 
CTgGGGaACG TTAAAAGTTA ACGGkTGATA TCyAACtAAA AACAAGGTCA CAGTAGTATG 
TTTTAATCTG GCGTCTATTA CAAATAAAAA TTACATCTAT AATTATTCGT TTT C T TTT T T 
GAAAGTAATA GCCAATTAAT ATCATACATA CTGGAGTGAC TATAAGGAGG ACATTATTAT . 
GAGAGCAGCA GTTGTAACGA AAGftTCACAA AGTAAGTATT GAGGACAAAA AGTTAAGAGC 
TTTAAAACCT GGTGAAGCGT TGGTACAAAC GGAATATTGT GGCGTTTGTC ATACCGATTT 
ACATGTTAAG AATGCTGATT TTGGTGATGT TACAGGCGTT ACTTTAGGTC ATG AAGGT AT 
TGCFAAAGTC ATCGAAGTTG CGGAAGATGT AGAATCATTA AAAATTGGAG ACCGTGTGTC 
TATCGCTTGG ^ ATCTTC 

ACTTTGCCGT AGTGTGAAAA ATGCTGGTTA TACAGTAGAT GGTGCAATGG CTGAACAAGT 
TATTGTTACT GCAGACTATG CTGTGAAAGT ACCTGAAAAA TTAGATCCAG CAGCAGCGTC 
TTCTATTACA TGCGCAGGTG TGACAACTTA TAAAGCTGTA AAAGTAAGTA ATGTAAAACC 
TGGACAATGG TTAGGTGTTT TTGGTATAGG TGGTTTAGGT AAC CTAGCTT TACAATATGC 
TAAAAACGTT ATGGGGGCTA AAATTGTTGC CTTCGACATC AATGATGATA AATTAGCATT 
CGCGAAAGAA TTAGGTGCTG ATGCTATTAT TAATTCTAAA GATGTTGATC CAGTTGCAGA 
AGTTATGAAA TTAACTGATA ACAAAGGATT AGATGCAACA GTGGTAACTT CAGTTGCTAA 
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TTTACCTGTT GATAAAATGA ACTTAGATAT CCCAAGATtA GTGCTTGATG GTATTGAAGT 12 $0 

AGTAGGTTCA CTTGTTGGTA CAAGACAAGA CTTACGTGAA GCGTTTGAAT TTGCTGCTGA 1320 

5 AAATAAAGTA ACACCTAAAG TTCAATTAAG AAAATTAGAA GAAATCAATG ATATTTTTGA 1380 

AGAAATGGAA AATGGTACTA TAACTGGTAG AATGGTTATT AAATTTTAAA AATATCAACT 1440 

GACTATATAG ATAAAGAAGG TAGTGCTCTG AACACTATCA TTATTAATCA AACCCCGAGG 1500 

W 

TTTTCCTGAA AAGATAGTGG nAAATCCCCG TGTTTTTTGG GTTTGAGGnG GTTGTnTGTA 1560 
(2) INFORMATION FOR SEQ ID NO: 91: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11014 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 91: 









ACGCCTT AAAA 


ATCCAGGGAT 


GTAATGGATA 


CTTTGTGGTA 


60 


25 


GTACTAATGA 


TAGAAATGAT 


AAAAATGAAA 


TCACAAAGGC 


TACGCTCGCA 


AAAGCTTGAC 


120 




ATGTACGCTT 


ATCGCCATAA 


TCTAACCCTG 


TACGTATATG 


TAATAAATAC 


TGTAATCCGA 


180 




TACTTAAATA 


CATAATTGCC 


ACGCATAAGA 


AGAATGGGAA 


GAATGTCTTT 


TCAAAGTCCG 


240 


30 


GATATAGGCT 


GTTAGATAGG 


AAGACCATGA 


TGAACATATT 


AAACATCATA 


AACGAGACGT 


300 




CTTTGAATGT 


AACTTGACCA 


AATCGATTTG 


TAAAAAATGT 


TTGATGAGAC 


CACATT AAC C 


360 


35 


ATAAGAACAA 


ACTCATGACG 


ATGTATTTGA 


AAAATAAATC 


AGCTGAAATG 


GAACCGTTTT 


420 


GTGTTGTTAA 


AATCACATGT 


GCAArrrrrr 


GAATGGCATA 


GACGAAAATT 


AAATCAAAGA 


480 




ACAACTCATG 


GAATCCTGCA 


CGCTTTTCAG 


CTAAATGTTT 


TGGTGTTAAT 


GCATTAACCA 


540 


40 


TAAAATTTTA 


ACTCCTTTAA 


GATGTGTAAT 


TAATTTACTA 


AGTATACTAT 


TTATTTTTTC 


600 


TAGTGAATAG 


GGGCAGATTT 


GGCGATGAAG 


TGGAAGGAGA 


GGTGACTGCA 


AGGTAATTGC 


660 




GGAATTAACA 


ATCATCAGCG 


ATTTAATATT 


TGACTGGAGA 


CGTCATGGTA 


ATAAAAAATT 


720 


45 


GATGAGAAAT 


TGATGGTGAA 


ACCAGCTGTG 


AATAsCGaTG 


cAATGATrsA 


TAGaATTTAA 


780 




TTAGAGTCAT 


TACGCGaAAT 


GATTAATGAT 


AATTTGTGGT 


AAATCAAAGC 


aTAATTTTGT 


840 




ACTATAGATG 


AGGATGATAG 


AGCATATTTA 


AGAGGGTGAA 


ATGTTAAAGT 


GAAACCGTTT 


900 


SO 


ACGTTT CCGA 


TTGCCCAAAC 


AAATTACATC 


ATTGTATAAT 


ATGATTTGTT AAATGCATAA 


960 




CAAGAATGAA 


AATGTAACAT 


ACGTAGCAAT 


TGGTTTCATA 


AATTGGATGT 


TAGTGGCGTA 


1020 
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TGACGAGAGT CGTATTAGCA 


G CAG CAT ACA 


GGACACCTAT 


TGGCGTTTTT 


GGAGGTGCGT 


1140 




TTAAAGACGT GCCAGCCTAT 


GATTTAGGTG 


CGACTTTAAT AGAACATATT ATTAAAGAGA 


1200 


5 


CGGGTTTGAA TCCAAGTGAG 


ATTGATGAAG 


TTAT CATCGG 


TAACGTACTA 


CAAGCAGGAC 


1260 




AAGGACAAAA TCCAGCACGA 


ATTGCTGCTA 


TGAAAGGTGG 


CTTGCCAGAm 


ACAGTACCTG 


1320 


10 


CATTTACGGT GaATAAAGTA 


TGTGGTTCTG 


GGTTAAAGTC 


GATTCAATTA 


GCATATCAAT 


1380 




CTATTGTGAC TGGTGAAAAT 


GACATCGTGC 


TAGCTGGCGG 


TATGGAGAAT 


ATGTCTCAAT 


1440 




CACCAATGCT TGTCAACAAC 


AGTCGCTTTG 


GTTTTAAAAT 


GGGACATCAA 


TCAATGGTTG 


1500 


15 


ATAGCATGGT ATATGATGGT 


TTAACAGATG 


TATTTAATCA 


ATATCATATG 


GGTATTACTG 


1560 




CTGAAAATTT AGTAGAGCAA 


TATGGTATTT 


CAAGAGAAGA 


ACAAGATACA 


TTTGCTGTAA 


1620 




ACTCACAACA AAAAGCAGTA 


CGTGCACAGC 


AAAATGGTGA 


ATTTGATAGT 


GAAATAGTTC 


1680 


20 


CAGTATCGAT TCCTCAACGT 


AAAGGTGAAC 


CAATCGTAGT 


CACTAAGGAT 


GAAGGTGTAC 


1740 




GTGAAAATGT ATCAGTCGAA 


AAATTAAGTC 


GATTAAGACC AGCTTTCAAA AAAGACGGTA 


1800 




CAGTTACAGC AGGTAATGCA 


TCAGGAATCA 


ATGATGGTGC 


TGCGATGATG 


TTAGTCATGT 


1860 


25 


CAGAAGACAA AGCTAAAGAA 


TTAAATATCG 


AACCATTGGC 


AGTGCTTGAT 


GGCTTTGGAA 


1920 




GTCATGGTGT AGATCCTTCT 


ATTATGGGTA 


TTGCACCAGT 


TGGCGCTGTA 


GAAAAGGCTT 


1980 


30 


TGAAACGTAG TAAAAAAGAA 


TTAAGCGATA 


TTGATGTATT 


TGAATTAAAT 


GAAGCATTTG 


2040 


CAGCACAATC ATTAGCTGTT 


GATCgTGAAT 


TAAAATTACC 


TCCTGAAAAG 


GTGAATGTTA 


2100 




AAGGTGGCGC TATTGCATTA 


GGACATCCTA 


TTGGTGCATC 


TGGTGCTAGA 


GTATTAGTGA 


2160 


JO 


CATTATTGCA TCAACTGAAT 


GATGAAGTTG 


AAACTGGTTT 


AACATCATTG 


TGTATTGGTG 


2220 


GCGGTCnAAC TATCGCTGCA 


GTTGTATCAA 


AGTATAAATA 


ATAAGAAAAC 


AGGTTATCAC 


2280 




AACAffTATTA ATtACATGTT 


GGCATAACCT 


GTTTTTATTT 


GTTTATGGAT 


TTATTGGGTA 


2340 




ATATTAGTCA TTTGATGGTT 


TAATTG CAAA _ 


.TGCT.CTAACA _GGGAACCCAG_ GTGCATCTTT 


— 2400 




TGGTTTAGGG CTGAT AGCGT 


AAATGATGGC 


GCCACGAGTT 


GGTAATTGAT 


CTAAATTAGT 


2460 




TAATAACTCG ACTTGGTATT 


TATCCTGACC 


AAGAATATAA 


CGTTCGCCAA 


CTAAATCACC 


2520 


45 


ATTTTTTACA ACGTCCACAG ATGCATCGGT ATCGAATGTT TCATGACCAA 


CAGCTTCAAC 


2580 




ACGACGTTCT TCAATTAAGT 


ACTTCAAAGC 


ATCTAATCCC 


CAACCCGGTG 


CATGTTGTTG 


2640 




TCCGTTCGCA TCTTTGTTTT 


CAAACTTTTC 


AATATTAGGC 


CAACGTTTTG 


ACCAATCGGT 


2700 


50 


ACGAAGTGCA ACAAAAGTGC 


CAGGTTCAAT 


AGTACCATGC 


TCTTTTTCCC 


ATGCTTCTAT 


2760 




ATGCGCACGT GTTACGATGA 


AATCATTGTT 


GTTCGCTACT 


TCTGTTGAAA 


AGTCTAATAC 


2820 
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AAAGTGAATT 


GGTGCATCAA 


TGTGAGTACC 


ATATTGCGTT 


ACAATATTCC 


AACGTTGCAC 


2940 




ATAGAAACCA 


TGATCTTTAA 


CCGTGAATAA 


AGTTGAAACT 


TCGCCTmr 


CAAACTCACT 


3000 


5 


AAAACGTGGT 


ATTTCCGGAT 


CAAATGTATG 


CGTTAAATCA 


ACCCAAGTTG 


CTTGTTTTAA 


3060 




AGTATTTAAT 


TGTTGCCATA 


AAGGATATTG 


TGTCATAAAA 


TCACCCGTTT 


TTAGTTTATT 


3120 


10 


ATATGATAAA 


TGCTGCGATT 


ATTCTTGGCG 


TTTAGCTTTA 


ACAGCATTCA 


CAAGCACAGT 


3180 


CAATGCATCT 


TTAACTTCTT 


CTTCTTTTCG 


CG'rrriTAAA 


CCACAGTCAG 


GGTTTACCCA 


3240 




GAATAATGAG 


CGGTCGATTT 


GTTGTAGTGA 


ACGATTGATT 


GCTGTAGTAA 


TTTCTTCTTT 


3300 


15 


TGTTGGAATA 


CGTGGACTAT 


GAATATCATA 


TACACCTAGA 


CCAATACCTA 


AATCATAATT 


3360 




AATATCTTCA 


AAGTCTTTAA 


TTAAATCACC 


ATGGCTACGA 


GATGTTTCAA 


TTGAAATAAC 


3420 




ATCAGCATCT 


AAGTCATGAA 


TAGCATGAAT 


GATTTGACCG 


AATTGAGAAT 


AACACATATG 


3480 


20 


TGTATGGATT 


TGAGTTTCAT 


CACGAACTGA 


AGACGTTGCA 


AGTTTAAATG 


ATAAAACAGC 


3540 




ATCTTTAAGA 


TATTGTTCGT 


GATATTCAGA 


GCGTAATGGT 


AAGCCTTCAC 


GTAATGCAGG 


3600 




TTCGTCAACT 


TGGATAACTT 


TGATTCCTGC 


AGCTTCAAGT 


GCTAATACTT 


CTTCGTTGAT 


3660 


25 


TGCTAAAGCA 


ATTTGATCTT 


GAACGACTTT 


ACGTGGTAAA 


TCAACACGTT 


CAAATGACCA 


3720 




GTTTAGAATT 


GTTACAGGTC 


CAGTTAACAT 


ACCTTTAACT 


GGTTTATCTG 


TTAAGCTTTG 


3780 




TGCATAAACT 


GTTTCATCAA 


CAGTTAAAGG 


CGCTGTCCAT 


TTTACATCAC 


CATAAATGAT 


3840 


30 


TGGTGGTTTT 


ACGGCACGTG 


AAC CAT ATG A 


TTGCACCCAA 


CCGAATTTAG 


TTACTAAGAA 


3900 




ACCTTGTAAT 


TTTTCTCCGA 


AGAATTCAAC 


CATGTCATTA 


CGTTCAAATT 


CACCGTGAAC 


3960 


35 


TAATACATCT 


AAGCCAATGT 


CTTCTTGAAT 


TTTAATCCAT 


CGAGCAATTT 


CATTTTTTAA 


4020 


GAATGTTTCA 


TATGCTTCGT 


CTGTAATGCG 


TTTGTTCTTC 


CAATCTGCAC 


GGTATTTTCG 


4080 




AACTTCTCGG 


CTtTGTGGGA 


ATGATCCAAT 


AGTTGTTGTT 


GGTAAATCCG 


GTAAGTTCAA 


4140 


40 


ACGTTTTTGT 


TGTTGTTCAA 


TACGTTGCGC 


GAATGGTGAT 


TGTCTTGAAG 


TACGCACGCT 


4200 




TTCGAAATCA 


TAATCTAAGT 


TTTTGAATGA 


TTGATTTTGG 


AAACGCTCAT 


AAOGTGCTTT 


4260 




TAATTTATCA 


TATTTAACAC 


TATCGTTTTG 


ATTAAATAGG 


CGACGCAATG 


CATCTAATTC 


4320 


45 


GTCTAATTTT 


TCAGTTGCAA 


AGCTTAAGCC 


TTCGCCAACA 


CTTGTATCTA 


ATGTTTCATC 


4380 




ATCTAAAGAT 


ACTGGAACAT 


GTAATAATGA 


AGATGATGGT 


TGAATGACAA 


GTTCATTAGT 


4440 




GTGTGCTAAC 


AATTTATCGA 


TTAAGACTTT 


TTTAGCTTCA 


ATGTCACTTG 


CCCATACATT 


4500 


50 


ACGACCATCA 


ATAATTCCAG 


CGTATAATGT 


TTTTGATTTA 


TCAAAATCTC 


CAGCTTCAAT 


4560 




TTGTTTAAGG 


TTATAGCCAT 


TATCATGGAC 


AAAGTCTAAA 


CCTATACCAC 


CAACAGGTAA 


4620 
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AACACCAGCT TTTTCGAAAT AGTCATAAGC TTCACGTGTA ATATTTTCAT AGCTTTCGCT 

GTCGTCTGTA ACTAAGATTG GCTCATCAAC TTGAATGTAC TCAGCACCTG CATCAATTAA 

5 

TGATTCAAAC ACTTCTTTAT AAAGTGGTAA TAACGTTTTA ACTTTTTCTT CAAAAGTTTG 

GTGACCGCCT TTTGATAATT TAACAAAAGT AATCGGACCA ACAATGACAG GGTGAGCGTT 

10 AACGTTTAAA GATTGGGCAT ATTTAAAGCG ATCTAATAAT ACATTGCGAC TCACTTTAGG 4980 

CTCAACATTG TCCCATTCAG GTACGATGTA ATGATAGTTA GTGTTAAACC ATTTTATAAG 504 0 

TGCACTTGCA ACATGGTCTT TATTACCGCG AGCAATATCA AATAATAAAT CATCATCAAT 5100 

75 AGTTCTTCCT TGGAAACGTT CAGGGATGAT GTTGAATAAT AATGACGTAT CTAATATATG 5160 

GTCATATAAA GAGAAATCAC CAACTGGGAT GCTATCTAAG TGATAGTACT TTTGtAATAA 5220 

TAAATTTyCT TTATGTAGAT CAGTTAATGT TTGATCTAAT TCTTCTTTAG AAATCTTCTT 5280 

20 TGCCCAATAA CTTTCGATGG CTTTTTTCCA TTCTCTTTTT CTACCTAATC TTGGGAATCC 534 0 

TAAGTTTGAT GTTTTAATTG TTGTCATAAT ATTGCCTCCT TGTGAGCAGT AATAGATTTT 5400 

GAGTATGCTG CAAGTTCTAA TGAATCTTCG ACATTTTGAA ACGGTGTGAT AATGTATAAA 5460 

CCATTAAAAT ATTCATGAAC AGTATCGATT AAATCCTTTG AAAGCTTAAG ACTTAGTTCT 5520 

CGTGTTTTGG CTTTATCATC TTTAACTGCT TCAAATTGTT GTAAAATTTC ATCTGACATC 5580 

TTGATTCCTG GCACTTCATT ATGCAAAAAG AGTGCGTTTT TGTAACTTGC GATAGGCATA 564 0 

ATGCCTATGA AAAATGGTTT GTTCAAGTGC TTAGTGG CAT GGTAAATTTC AATGATTTTC 5700 

TCTTTGCTGT ACACGGGTTG TGTTATAAAA TAAGACATTC CGCTTTCTAT CTTTTTCTCT 5760 

AATCTTTTGA CGGCACCATA TAATTTACGA ACATTAGGGT TAAAGGCGCC AgcGATGTTG 5 820 

AAGTGTGTAC GTTTCTTCAG CGCATCACCG TCAGTGTTAA TACCTTGATT AAATCTTAGA 5880 

GCGSGTTCAG TTAATCCTTT AGAATTAACA TCATAGACAT TGGTTGCACC TGGTAAGTGA 594 0 

CGAACTTTTG- AAGGATCACC AGTTATGGCT AATATTTCGT TAACGCCAAT GAGCGATAAT 6000" 

CCAAGTAAAT GGGACTGCAA GCCGATTAAG TTTCGGTCTC GACATGTAAT ATGTACGAGT 6060 

GGTTCAATAT TGTAATATTG CTTAATTAAG CTAGCAGCAG CAATATTGCT AATTCTGACA 6120 

45 GTTGCCAATG AATTATCTGC GAGTGTTACC GCATCTACAT TAGCTTTATC AAGTTTAGCG 6180 

ATATTTTCAA AAAATCTATC CGTGTCTAAA TGTTTCGGTG TATCCAATTC GATAATAACG 6240 

GTTGGACGTT CTTGAACCTT AGATGTTAAT GATTGTCTAA CTTTATTTTG AGATGGATTG 6300 

50 AAAAGTGCTT TCGTTGGTAT CGGAATCACT TTTTTGTCAT TAACAGGTTT AAGTGTCTGA 6360 

ATAGATTCTT TAATAAATTT GATGTGCTCT GGCGTTGTAC CACAGCAACC ACCAATTAAA 6420 
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TACTTAAATT CACTATTTTC AATATCTAAT AAGCTGGCAT TTGGATAACA AGATAAGAAT 6540 

GCGTGCTCTG GTAATTCAAT ATGTGTGAAA GACTCTTGCA TATGGTGCGG GCCATGATGA 6600 

CAATTGAGTC CCACGATGTT TGCACCACAT TGAACGAGTT GTTTTAATCC TTCATTGATT 6660 

GCCTGACCAT TAACTAAGTA ATTTGTGTTT GAAGCGGTTA ATTGAGCAAT GATTGGAATG 6720 

TCGTATTTCT TTCTCGTTCG TGAAATGACA TTTGTTAACT CTTCTAGGTC GTAATACGTT 6780 

TCGAAAAGTA GCGCGTCAAC GCCTTCTTCA ATTAAGGTGT CTATTTGAAT TTCAGTATGA 684 0 

TAAAGAATAG TTTGTAAGCT GATATCCTCT TGTTTGATAC CTCTAAACCC ACCAACTGTG 6 900 

CCTAATATAT ACGTATCTTT ATTTGCTGCT TTTTTTGCGA TGCGAACGGC GGCTTGATGT 6960 

ATTGCTTTAA CTTTATCTTC AAGACCGAAT CGTTTTAACT TTTCAAAATT TGCACCATAA 7020 

GTATTGGTTT GAATGACATC AGCACCGGCT TCAATATATG AACGATGGAT GCGTTCAACT 7080 

20 TTATCTGGAT GGCTAAGATT ATATG CTTCT GGACAGGTGT CTAATCCTTC AGAGTATAAA 714 0 

ATGGTTCCTA TAG CGC CATC AG CTACT AAA ACATTATCTT TCAATTGTGT GAGGAATTGA 72 00 

CTCATTGAAT GCCTCCTTTA ATGCGTATTT GATGTCTGCA ATGAGTTCAT CAGGATCTTC 7260 

25 GAGACCAACA CTTAATCGGA ATAGACCGAA AGTGATACCA CGTTCTTGTC TCACTTCTTC 7320 

AGGTAGTGCA GCGTGAGACA TTGTTGCTGG ATGTGAAAGG ATCGTTTCAA CACCGCCCAG 73 8 0 

ACTCACTGAA ACGAGTGGTA ATGTCAGTGC ATCGACAAAT TGTTGTGCTT TAGACTCATC 744 0 

AGCTAAACGA AAGCCAATAA CGGCACCGCC ATTTTTAGCT TGTTCTAAAT GAGCAGTAGT 7500 

GAGTCCCGGA TAATAAACTT CTGAAATTTC ATCTTGCTTT ATTAAAAATG ACACGATTTT 7560 

TTGAGCGTTT TCGACAGATT GTTTAAATCT GATTGGAAAA GTTTTTAAAT GTTTAGCAAG 7620 

TGTCCAGCTA TCCTGAGCAG ATAACATATT GCCTGTACCA TTTTGTATTA AATAAAGAGC 76 80 

GTCACTAATT GCCTCATTAT TAGTTATGAC AGCACCAGCA ATTAAATCGC TATGTCCACT 774 0 

TAAAAATTTT GTAGCACTAT GAATGACAAT ATCAGCGCCA AGTAATAAAG GTGATTGACc 7800 

TAACGGTGTC ATAAATGTAT TGTCCACAGC TACCAGTAGT TCATGCTTTT CGGCTATTTT 7860 

AGAAACAGCT TTGATATCAG TAATTTTAAA ACAGGGATTC GATGGTGTTT CGATATAAAT 7920 

TAATTTTGTG TTTGATTGAA TGGCACCCTC GATTT G TTCG AGCTTTGTAG TATCTACGGT 7980 

TGTAAATTCA ATATTAAATC GATTCAAAAT TTGCTCAGTG AGGCGAAAAG TACCGCCATA 804 0 

TACATCATCG GGTAAGATGA CATGATCACC AGATTTGAAA GTCAAAAGTA CTGCTGAAAT 8100 

SO AGCAGCAATA CCTGATGCAA AAGCAAAAGC GAATTTTCCC TGTTCTAATC GTGCTAACTT 8160 

CTCTTCTAAA AGTT CACGGT TAGGGTTGCC CTTCGTGCAT AATCATATTT AACATCG CCA 8220 
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TCCACACCTC TACGCCAATC GAATATCACT TCTGTCTCTT TTGAAAGTGT CATACAATCT 834 0 

CTCCAATCTG AGCTTTATCT AATGCTTGGA TGATATCGCG TTCGATGTCT TCATAATTTT 84 00 

CAACACCTAG TGATAAGCGG ATTAAATACT CATCAATGCC ACGTTTATCT TTTTCAGCAT 8460 

CTGGCATATC AACATGTGTT TGGGTGTAAG GGAAGGTCAC TAATGTTTCA GTACCTCCTA 8520 

AACTTTCTGC AAAAATGCAA ATGTCTAAAT TTTCTAATAA TTTAGCGACG CTATAGGCCT 8580 

TGTTAAGTCT TAAACTAAGC ATGCCAGTTT GCCCGCTATA TAGTACTTCG TCAATTGCTT 864 0 

GAAGTGACTG ACATTTTTTA GCAAGTTTTC TAG CGTTTGA TTGCGCACGC TCAATGCGTA 8700 

7S AATGCAAAGT TTTAAGTCCA CGTAACAACA AATAACTATC TATTGGTGAA AGTGTTGCGC 8760 

CAGTCATGTT GTGAAAATCA AACAACTGTT GCGCGAGTGA TTCATCTTTG ACGGTTACGA 8820 

CACCTGCTAG TACATCGTTA TGTCCGCCAA TATATTTCGT GGCTGAATGT AAGACTATAT 8 88 0 

^0 CAGCACCTTC TGCTAGTGGT GTTGAAAGAT AAGGTGTTAA AAAAGTATTG TCGATAATTG 8 94 0 

ACAATAAGCC TTTAGCTTTA CAAAGTTGAT AGTATGGCTT TACATCAATA GCAATCATTT 9000 

GTGGGTTAGA TATTGGTTCA ATGAATAATG CAACTGTTTT ATCAGTGATT TCTTTTTCAA 9060 

CTTGTTCATA ATCTGTAAAA TCAACGTACT TAAATTTGAT ATCGTATTGT TGCTCGTAAA 912 0 

ATTCAAATAA TCTAAATGTG CCACCATATA AATCGAATGA AACTAAAATT TCATCATGAG 9180 

GTTTAAATAG ATTACATATT AATTGAATGG CTGACATTCC ACTTGATGTA GCGAATGATG 924 0 

CAATACCATG CTCAAGTTTG GCAAAACAGG TTTGAAATGT TGAGCGTGTA GGATTTTTAG 9300 

TACGTGTATA ATCAAAACCT GTCGATTGTC CTAGTTTTGG ATGCTTGTAG GCAGTAGATA 9360 

AATGGATTGG ATTCG CTATA GCAC CGGTTG AATCATCGGT TAATGTGATT TGGGCTAACT 942 0 

GTGTATCCTT CATATTAAGA CCCTCCTATA AGAAAAAATA AAAAAAGCTT CCGTCCTTCG 9480 

TACCCGAATG AATCGGATAA AAAGGACGAA AGCTTATGTT TCGCGGT AC C ACCTTTATTT 954 0 

-GTTATTGCAT— CGCTGAAATA—ACCTTATTCA~GTA 9600~ 

ACAATTATCA CAATTAAAGT CAGTAAGTAA GGATATAGTA ATGTGCTATC CCATACTTAT 9660 

TAACAAAAAA TCGTGCGTAA AGAATCCAGT ACGCCATTTA ACAT CAATGT TAATACTGTA 9720 

45 TCG CTATAAC GGGCGAACCC GTAGACACCT CATATTGGCA TCAACACTCC AAGGCCATTT 97 80 

TCAAACACGC TTTCAAAATC TTCTCTCAGC TACTAAAGAC TCTCTGTATA AGCAGGGTGT 984 0 

GTTTTACTTy CCTCTTTATT GTGTTTACGT TTCATTAAAC TGTTATAAGA TATTAATTAG 990 0 

50 

CTTACAGAGT AAAAAAAGAT TTGTCAACAA TTATTCAGAA AATTTTGATT TAAAAGTTAA 996 0 

TTTGTTTGTG AAATTGTAAT TGGTATCTTG AAGTTGAAAA ATGAATTATT TTTTAAATAA 1002 0 
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TCAAATAAAA AGTGATGTGA GTGAATTGTC AAAAAGTGAA GATCAACGTA TTACTAAAAC 1014 0 

AAAAGATGAA CAAATTAAGC AAATAGATAT ATCGGATATC AAACCGAATC CGTATCAGCC 10200 

CCGAAAAACT TTCGATGAAA ATCATTTAAA TGATTTGGCA GATTCAATTA AGCAATATGG 10260 

AATTTTGCAA CCAATTGTGC TTAGAAAAAC AGTTCAAGGT TATTACATTG TAGTTGGTGA 10320 

AAGAAGGTTT AG AG CTTCGA AAATTGCTGG TCTAAAATAC GTATCAG CGA TTATCAAAGA 10380 

TTTAACAGAT GAAGATATGA TGGAACTGGC GGTCATCGAA AATTTACAAC GAGAAGACTT 10440 

AAATGCGATT GAAGAAGCTG AAAGTTATCA ACGTTTGATG ACAGATTTGA AAATTACACA 10500 

ACAAGAAGTA GCGAAACGAT TGAGTAAGTC GCGCCCGTAT ATAGCGAATA TGTTGAGGTT 10560 

ATTACATTTG CCGAAAAAGA TTGCTGACAT GGTAAAAGAT GGGCGACTGA CAAGTGCACA 10620 

TGGACGAACG TTATTGGCAA TTAAAGATGA ACAACAAATG CTTAGGTTAG CGAAACGGGT 10680 

TGTTAAAGAA AAGTGGAGTG TCAGATATTT AGAAAACCAT GTTAATGAAT TAAAAAATGT 10740 

TTCGTCAAAG TCGGAAACAG ACAAAGTAGA TATAACTAAG CCTAAATTTA TAAAGCAGCA 10800 

AGAACGACAG TTGCGAGAAC AGTATGGTAC CAAAGTAGAT ATATCAATAA AAAAATCGGT 10860 

TGGTAAAATC TCATTTGAGT TTGATTCACA AGAAGATTTT GTGAGAATAA TTGAACAATT 10920 

AAATCGTAGG TATGGTAAAT AGTTACACAA TTTTATATAA TAACTCTTTG TGCAAGTGTA 10980 

AATAAATTGT AATCAGTGAC ATTTGATTCT AGAT 11014 
(2) INFORMATION" FOR SEQ ID NO: 92: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6 022 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDN ESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 92: 

TCCCCTTATG GAATTTCACA TTCTAGTTTA CATAATATAT ATTATAGGAA GTTATATGTG 60 

TGTAACGCAA AAgGTACCCT ACATCATAAT CATTATCTAA TATCGTCACA TAACTTACTT 120 

ATGCTATAAT CATGGTATTA TATTGTTTGG AGTGATTTGA TGAGATTTGT CTTTGATATT 180 

GATGGTACGC TTTGTTTTGA CGGCCGATTA ATTGACCAGA CTATTATTGA TACATTGTTA 24 0 

CAATTACAAC ATGATGGTCA TGAACTTATA TTTGCATCAG CACGTCCGAT TCGTGATTTG 300 

TTGCCAGTTT T AC CATCAGT ATTTCAT CAG CACACATTAA TTGGCGCAAA TGGTGCTATG 360 

ATTTCACAGC AATCAAAGAT TTCTGTTATC AAACCAATTC ATACTGATAC ATATCATCAT 4 20 
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GCTGCACAAC 


TTGACG CTGn 


AGAACGCGAT 


TTTTGAGCGT 


TTAGATCCAC 


ATAAGCTGGC 


540 


CAGTTGTATT 


GATGTTGCAA 


ATATCGACAC 


GCCAATCAAG 


AkTATTTTAT 


TAAATATAGA 


600 


CCCGGCACAA 


ATTACAACTA 


TATTAGACGA 


GCTAGATAAA 


TACCATCAAG 


AATTGGAAAT 


660 


GATTCACCAT 


TCAAATGAGT 


ATAACATTGA 


TATAACAGCG 


CAAAATATTA 


ACAAATATAC 


720 


TGCATTACAA 


TATATATTTG 


ATGCAGATGT 


TAAATATATA 


GCATTTGGTA 


ATGACCACAA 


780 


TGATATTGTC 


ATGTTACAAC 


ATGCTAGTAG 


TGGCTATATT 


ATAGGACCAT 


CAG AAG CAT A 


840 


CACACACGCA 


ATATTGAAAC 


TTGATAAAAT 


CAAACACATC 


AATAATAATG 


CACAAGCTAT 


900 


TTGCAAAGTC 


TTAAAATCAT 


ATAAATAAAA 


ACACCCCTAT 


CAAATGATAA 


TCATTATCAA 


960 


TCGATAGGGG 


CTATTTTAAT 


AAAATTCGTC 


CTCGAACATT 


TCTTCCTCTT 


CATCTAATCC 


1020 


AAATAATTCT 


GCCATTTCTC 


CATGTTCAAT 


TAACATGTTT 


AAATATGCAT 


CGCGGAGTTC 


1080 


TTCTTCACTC 


ATATCATTAA 


TCATTTCTTT 


AAGACTATCA 


ATCCACATAT 


TTCTGCGTAA 


1140 


TTGATAGTCT 


TCTTCAACTT 


CGTTTAACAT 


CATTATATGT 


TTATTTGCTG 


CTTCTGGACT 


1200 


AGCTGTAAAG 


AGTAATGCAA 


TCATATGTTT 


ACATATCACT 


CGTCTTCCAT 


CAGCATGAGG 


1260 


ACAATTACAT 


ATGGATTTTC 


TAGGATGTTC 


CATATCAATA 


TAACAACGAT 


ATACTTTGTT 


1320 


GCCACTGCCC 


TTTACTTCAG 


CCTCATGCTG 


CGTTTCTGAA 


AATGATTTTA 


AGTTAATGAC 


1380 


GCATTCACTT 


TGATAATAAT 


TAAAGCCTCT 


TTCTATAGAA 


CGAATACTTG 


CAATATCAAG 


1440 


TAATCCCATT 


AATGaTACTC 


CTTTTTATTA 


TTATTTTTAA 


ATAAAGAaAA 


TAAAATAGAT 


1500 


AAGTGTCTAG 


ATTAAAATAC 


TTGATTTATC 


TATATTTTAT 


AACAAGTCTA 


GAATTATCGC 


1560 


ATTCTTAAAT 


AACTAATATG 


AAAATGcTTG 


CACTAATTCt 


TTTGTATAAG 


GGTGTCTATC 


1620 


AACATTAAAT 


AATTCCtCTA 


TTGCAAAATC 


ATCGACTATC 


ATGCCATCCT 


TAAGAACGAT 


1680 


aattCtatta ACTAAGCGTT GTAACACGGA 


TAAATCATGA 


GAAATAACGA 


TAAAATGATT 


1740 


TAAGTTCGTA 


ATCGTTTGCG 


CTTTTAATAT 


ATTGATTACA 


TTTTGTTCAG 


CTATAACATC 


1800 


ta^tttgaaT 


GTTATCTCAT 


CACATATTAA 


AACGCGAGGC 


TGTGCTAATA 


ACGAACGCAT 


1860 


GACATTAAAT 


CTTTGTAATT 


GTCCGCCACT 


GACTTCG CTT 


GGTAATTTAG 


TCAATAATTG 


1920 


CGCGTTTAAC 


TCAAAAGTAG 


ATAAATGTTG 


TAATAATAAT 


TGATCCTGAG 


CAGTATTATC 


1980 


AGTTAGACCT 


CTGTAATAAT 


ATAACGCTTC 


TTTTAATGAG 


GTCTCAATCG 


TCCAATCAGG 


2040 


GTTAAAGCTA 


GTTAAAGGGT 


GTTGGAAAAT 


CGGTAACACA 


GCATTGTCAC 


TTAAGTAAAT 


2100 


CTCTCCTTTA 


ACAGGTTTAA 


ACAAGCCAAG 


AACCAATGAA 


GCGAGCGTAC 


TTTTACCACA 


2160 


GCCACTTTCG 


CCTAAAATAC 


CAACATTTTC 


TCCATCAGGT 


ATAGTAATAT 


TGAT AT CTTG 


2220 
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CCCTCTTTAA TTGTGTTCTA TATTTAATTA GACGTTCAGT ATACGGATGC AAATGCTCAT "234 0 

ACTTGAAATG ATTAATATTA CCTCGTTCAA TGATTTGACC TTCTTTTAAA ACATAAATGT 24 00 

ACTGACAATA TTTCAATACA TGACTTAAGT TATGTGTGAT AATAAATAAT GTTTG AC CAT 24 60 

GTTCTAATAC AATATGCTGT AATAAATCCA TCACTTGATT ACCGTTCAAA GCATCCAATG 2520 

ATGCAACTGG TTCGTCTGCA ATGATTAATT TAGGCTCCAA CATGAGAACG CTTGCTATGT 2580 

AT ACG CGTTC AAGTTGGCCC CCAGAAAGTT GGAAACTATA TTTATTTAAT ATATCTTTGC 2640 

TTTGTAAATT AACCCACGAC AAAGCCTTAT CAACTTTGGA CAAAGCCTCT TCTTTACTAC 2 700 

CTTTATAATG CTTACGATAA ATCGCAGTTA ACTGTTTACC TAATTTAGTA TGGTCGTTAA 276 0 
AACTTTCTGC ATAATTTTGA GAAATATAGC CAATTGTATG ACCATAATAT TGACTCAATC • 2820 

TACTAACATT TTCCCCATCA AATTGGTACG AATCATACGT GCAGCTTAAA TCAAATGGTA 28 80 

AATATTCAAG TAAAGCTTTA GCAATCAAAC TTTTTCCAGC GCCGCTCTCT CCAATCAAGG 294 0 

CATTAATCTG TTGACTAAAA ATTTTCAAAT CAATCCCTTT AATAAGAGAT TTCTOACTAG 3000 

TATTCTTTAT TGTTAAATTT TGTATATCAA TGAGACTCAT CATATTCACC CCGTTGTTTC. 3060 

AGCAATCTAT CTCTTAGTGC ATCACCGGTT AAATTAAAAA TTAAAATAGT TATAGCAATG 3120 

ACTGAAGCAG GTGCAATCAA CATAATTGGA TGAGACGAAA TAAAATCACG ACCTTGTTGC 3180 

AACATAGCGC CCCaCTCTGG TGTTGGCGGT TGTGCACCTA ACCCAATAAA TGATAGTGAA 324 0 

CTTATATATA GAATGATTTT ACCGAAATCA ACGACCATCA AAACGATAAT AGCCGGTATA 33 00 

ATTTTAGGTG TTAAATGACG TATTAATATT GTTCTTGTTG GTACATGAAA TAATTGTGCC 33 6 0 

ATTTTTATAT AAGGCTTATT CATTTCGCTA TTAACTATAC TTCTAGTCAA CCTTGTGTAA 3420 

35 TTCATCCATT TTATTAATGT AATTGAGATA ACTAAATTCC ATAAAGATGG TTGAAAAAAA 34 80 

CTTGCTAAAG CAATCATGAT GATAAATTCT GGAATACTTA GACCAACATC AATAAACCTT 354 0 

AACACTAATC GTTCAATCCA CCCTTTTTTG TATCCGGCAA ATAGACCTAG TGTAACACCT 3 6 00 

40 ATGACAACGA TAG CT ATT AA TGTTAAAACA GTAACAAACA ATGTTGAACG TGCACCGATA 3660 

ATAATTCGGG TAAATAAATC TCTCCCATAA TCATCAGTTC CTAATAAATG CAACCAACTA 3720 

ATAGGTTCAA AAGTTTGTGA TAAATTGACT TTGGTTGCAT TTTCACTACT GACAAAGAAT 3780 

TGCAGTACAA TTACCACAAA AATAAATGCA ACGAATACAA AAAATATCAG GTTATTCTTT 384 0 

GAAAATATTT TATGCATGAC GGTCACTACT TTCTGATATC AATGGTGTAT TGGTTTTGAT 3900 

TTTTGGATTT CCTAATTGTA AACGCTGCTT CGGATCAAGT AATAACGTTA ATAAATCAGC 396 0 

AATCGTATTG ATAATAACAA CGAAGAAGCC AATAAATAAC ACGCATCCTT GAATAACAGG 4020 
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ATTTTCAATC ACTACAGTAC CACCTATTAG ACTGCCAAGT GAAATCCCTA GTAATGGGAT 4140 

AATCGGCAAA ATTGTTGGTT TTAGTAAATC ATGAATTAAA ATATAACGTT CATTCATACC 420 0 

GCGTAATCTT GATGCTTGTA CGATATTACT TTGCAATAAC ATCAATAAAT TAGAACGCAC 4260 

TAAACGAATG ATGTATGCAC ACATACCTAA AGATAGCGTG ATTACAGGTA ATATAAACTG 43 20 

ACTTAGTATA ACGCTATCTA TATTCATTAA ATTTGTGACA ATAAATAATA AAATAATACC 43 80 

GATAAAGAAC GCTGGTAAAC TAATCGATAG TGTTGAGATC ACTCTAATCA CTTTATCCGT - 4440 

CCACTTATGA AATCGTTTGG CTGCTATAAT GCCGAGCGGT ATAGATATGC ATAACGACAC 4 500 

TACTAATGTT GAAAATGATA TGAGTAATGT TATGGGTGCA TAGTTGAATA ATATCTGTGT 4 560 

TACCGGTTCT TTTGATTCAA AACTTTTTCC TAAATTAAAA TGTAATAAAT GATTCATCCA 4 620 

ATGCCACCAC TGTACCAATA AAGAATCATT TAATCCCAAT TTATCTTTGG TTGCATTTAT 46 60 

TTGTTCCGTC GACACTTGTG CTACATCAAG ATGTAATATT TTATCAACAG GATTGCCTGG 4 740 

TG AT AATTT C ATTAAAATGA ATGTAAGTGT AGAAATAACA AATAAAACAA CTATCATTTG 4 800 

CATCAGTCTA TACAACATAG ACTTTATTAT GAACATAATA GTCCCCCTCC TTGTGTAAGT 4 860 

25 TACTAACACT TTCTTTTTAC ATGAGAATGG CGCATGTATA TGCAACTTAC ATATTAAGAA 4 920 

CTAACGTTCA TTATAGTATT ATC CATAAAG AAATTGAAGT ATATTTAATT TTTTAACAAA 4980 

ATCATTATAA AATATAATAT TTTGAATCAA GTCAACCATG TAAAATATAA AAAAGTCAAA 5040 

30 ACAAAAACAA CTATAGCACT GTATTCCATC TCTTTCGAAA TAATTGTTAC TGCAGTGTAA 5100 

CTTAAAAGTC GATGATTTTG TG CAT AT AGT TGTCGAATAT TATTTTTTAT CTTTACGGCG 5160 

AAGTTCAGCG CCCTCATAGC CGTATTTTTC AATTTGCTTT TCTAATTTAC GCGCTTTTCT 5220 

TTCTTTACGC CAATTTCTAG TAAAATACCA TAATAGAAAA CTAATTAATA AACTCATAAT 5280 

CGCTAAAAAT GCAGCGTATC CTAATAATGG TTGATATTTT ATATCTTGAA AATTTGGAAT 53.40 

AAAAAATGCA AGCACACCTA ATATAACAAA TGTAATTACT GCAGATACAA ACCATTTATT 5400 
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TAAAACTAAG CAACAGAATA TTGTTAATAA AATCATTATT AATGTTGTGA TCCATAAATA 54 60 

ATTAGGCATA TCGAATAATG TCATATTCAT TCTCCTTTTA TTTCATTACT TTCCTTGTAT 5520 

ACATTTTATT ATAAATTTTT AAAAACTTAA ACAATAGCAG TCAGTTTCAA GCAATATTCT 5580 

ATCTACTAAT AGAAAAATCA TTGTTCCTTG CGACATGGAA ATCGTAACAT TATCGTTTAG 564 0 

GAGACAAAAT TATGTATAAT GAATGTATTA TACCAAAGGA GTGATTATAT GTCTCAAGGT 5700 

TTACCTTTAA GAGAAGATGT TCCTGTTTCA GAAACATGGG ATTTAGTAGA CTTATTTAAA 5760 

GATGATCAAC AATATTATGA AAGTATTGAC G CTCTAGTAC AnCAAGCAAA TCAATTTCAT 5 820 
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GAAAATATTT TAATTGCCTT AGATCGCTTA AGTAATTATG CAGAACTACG TTTAAGTGTA 5940 
GATACTAGTA ATATCGAGGC ACAAGTATTG AGCGCTAAAT TATCTACTAC ATACGGTAAA 6000 
ATTGTTAAGC CAATTATCCT TT 6022 
(2) INFORMATION FOR SEQ ID NO: 93: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 476 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

75 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 93: 

CCATCAATAA TGTATACATG ATTGGCATCA TATTCCCCTT TAATTAGAGA GCTACGTACA 60 

GTTTGTyTTA TTAAAGTAGA ACTAATAAAT AACCATCTCT TATGTGCACA AACACTTCCC 12 0 

GCAACAATTG ATTCAGTTTT ACCAACCCGT GGCATACCTC TAATGCCAAT CAACTTATGA 180 

CCTTCTTCTT TGAACAATTC AGCTAAAAAG TCTACTAACA AGCCTAAATC TTCACGCTCA 24 0 

AATCGAAAGG TTTTCTTATC TTTTGCATCT TGCTCAATAT ATCTTCCATG TCTTACTGCA 300 

AGACGGTCTC TTAATTCTGG TTTTTTAAGC TTTGTTATTT CAATTTCATT TATACCACGA 360 

GCTATTTGCT CAAAACGTTC AA CT TTT T CA AGATTGTCTG TTTTAATTAA AAGGCCTCGT 42 0 

30 TTACCTTGAT CAACACCATT AATTGTAACA ATACTTATAC CTAACATACC TAATAA 476 

(2) INFORMATION FOR SEQ ID NO: 94: 

<i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3633 base pairs 
35 (B) TYPE: nucleic acid 

<C> STRANDEDNESS: double 
(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 94: 

AGAAATACAA CGAAGCATAT AAATATAACC GATCTTTTTT CTAATTGAAT ATTAAGTAAG 60 

TGT ATGTACT TTCTGGAAGT AGCACCTAGT rGGATTGTtC CTCCTACAAC AGGCCAAAAA 120 

TTTTTATTTT TAACTGGCTT AACAGTGTTC AGTTTTTCAT ACTCTTCTCT ACTAATTTTG 180 

GCGCACCTTT TTGGAATGAA CCAATTAATA AATGGAAAAA AGTATACAAG CCAAGTTCTT 24 0 

ATTACATCGA CCATTAAATA CTCATCATCA TACTTAATAA CTCTGTATTT CGGATTTTTA 300 

TTGATAATTT CGGTTTCACA AAGCAATAAT TATCACTTCC TATTAATAAC AAATTCACAC 360 
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TTATATGACC 


TTAAATATAT 


AACATGAATC 


TTTTTGTCTA 


TTATTGAAGA 


CATATTTATA 


430 


s 


AAGAAAAA7A 


GCATTGTCAT 


AATAACCCAA 


GCAATAAATA 


CTATAATATT 


TTGGATAGAT 


540 




AAACTAATCA 


rrACATCTAA 


GAACATGATT gATAATCCAC CACAGAAAAA ATAAGAAAAT 


600 




AGTACAAAGC 


AAAGATTCTT 


GAATGATGGA 


AAAATCATAA 


TTTTTCCATT 


GCTACTCCGA 


660 


10 


TCATTATAGA 


TAGATAACTT 


TACTTTCTGA 


TTTAAATATA 


TATAAAACAC 


TAGAATACTT 


720 




AATAATAAAA 


CCGAACAAAT 


GATAATAAGG 


CAATTTTTTT 


CTAAATGAGA 


ATCAGGTATA 


780 




TATATTTTAT 


CTCTAAACAT 


AGTGCCAAAT 


AAAAGTATGC 


TACCTATAGC 


TGGCCATAAA 


840 


15 


GCTTTaTTTT 


TAACTGGTTT 


GACAATATTT 


AAATTATCAA 


AATCTTCTCT 


GCTGATTTGG 


900 




ACATATTTTT 


TTGGTATTAA 


CCAATTAATA 


AACGGAAAGA 


ACAAAACTAA 


CCAGGTGCTT , 


960 




ACTAAATCAA 


TCATCAGATA 


GTCGTTTTTA 


TATTTAATAA 


TTCTATATCT 


GGGATTTTTG 


1020 


20 


TTTACAACTC 


TAACCTCGCA 


AAGCAATATC 


TCCACTTCCG 


TCTCGTTGGT 


TTTATATCTA 


1080 




ATACACTTTC 


AGATACTTTA 


TAAGTGTTTT 


GTATTTTAGT 


AACATACTAT 


TTTCCTGTTT 


1140 




ATTACTTAAC 


TTACGAACTA 


CAATCTAAGT 


TTAGTAATTT 


CTATTGCTTT 


TTAAGTTTGG 


1200 




CATAAACCTT 


TTTATTACTA 


ATTGAGCCCA 


TGCTTATTAG AAAGAAAAAA ATTGTAATAA 


1260 




TAATCCACAT 


AATAAATACC 


AGTAGATTTT 


GAGGTTTTAT 


AGTCATTAGC 


CATATTAAAA 


1320 


30 


ATAATATAGA 


ACAACCTCCT 


AATAATAGAT 


ATGTGAAAAC 


TATAAAACTT 


CCATCTTTAA 


1380 




AAGTAGGCAC 


TAATATAACC 


CTATTTTCAT 


TATCTAGATT 


ATCATCATAT 


ATCTTTAGTT 


1440 




taagcttttt 


ATTTAAGTAA 


ATGTAAAATG 


CTGCAATACC 


TATAAATCCT 


ATAAAACATA 


1500 


3S 


AAGATATTAA 


AATCTTATTA 


TCTAATTGAA 


CTTCAAACGT 


ATGTACATAT 


TTCCGTAAAA 


1560 




TAACTACAAA 


TAAAAACGAA 


CTACCAGTAA 


CTGGCCAGAA 


AATATTATTT 


TTATTTTGTT 


1620 




TATCAACATT 


TAAATTTTCA 


AGTTCCTTCT 


CACTAAGTTT 


TGCATACCTT 


TTGGGAATGA 


1680 


40 


ACCAATTAAT 


AAAAGGAAAA 


AAGTATACAA 


GCCAAGTGCT TACTAAATCA 


ATTAACAAAT 


1740 




ACTCATCATT 


ATATTGAACG 


ACTTTATATC 


TCGGATTTTT 


ATTAATAACC 


TTAATATTAA 


1800 


45 


AAAGCAAAAC 


TCACCACGCC 


GATTTCATTG 


GATTTATATG 


ATTGCTAATA 


ATATTTTTAG 


1860 




CTTCACTAAC 


AGCATTCCCA 


ACACTATCCA 


TGGATTTTTC 


TGTAGTTTTT 


TTAAGAACAT 


1920 




CTATACTATT 


ATCGATTTTA 


TGCCCTACCC 


AGTCTACTTT 


ATCTTTTAAT 


CCAAAAATAT 


1980 


SO 


TATTTTGATA 


AATTAAATCT 


GTTCCTAATG 


CAAATACTGT 


ACTCATAGCC 


AAACCTGCTA 


2040 




AAATCACCCA 


TCCTACTGGA 


TTACTTCCTA 


AAACAAAAGT 


CGCTAATCCA 


GCTCCAACTG 


2100 




CTGTCCCTGC 


AGATCCAGCT 


GCAAGCGTgC ATACCATTAT GCGACAACGC CTCTCCAAAT 


2160 



55 
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10 
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CCTTTACCTA GGTATTTTCC GCCTTTTGCA AATTTACTAC CATTTTCTAT AAACACATTA 22 80 

CCTGATGTAC GTTTGACTTC CACAAATGAA TTTGGACCTG CTGGGCCTTT CACTCCACCT 2340 

GCTGTATTGa TAAATACACC GAATTTACTT GcATTTATAC CGTCTTGCTC TAAAAGTGTT 24 00 

GACGTAATAT CTAATCCTAT ATCTCTTTTA ATACTGTCTT TATTGTCATT TATATATTTC 2460 

AATATACTTT TCGGGATATC GTCTTCTGGA TGTTCTTTGG CATATGCCTT TATAACAGCA 2520 

AAGTCTGCTT TATTTAAAGT TTCTTTCTCT GCTTTATGTT CAATTTTCCC CATAGCAACT 2580 

TTCAAATATT TTTCATGACT TGCTTTGGCC CAATCAAGTT CTTTACCTGA AGGAATATTA 264 0 

AATTGATTTG TTGAAAAGTT CCAAAAATTC TGCGCTTGGG TAAGTCCTTG TTGGACAATT 2700 

TTTTGAAATT CTTCAACTTC TTTAAATATT TCTGGTGATT TTTGATTAAA CTCACGCAAT 2760 

TTGCGTAGCT TCTCTTCTAA TTCATGTTTT TGTTGACCTA ATGTTCGTAT TATTTGTTGG 2820 

20 TTCGATGAAA TGGCTTGCTG ATTATCGGAA GCATGCTTTT TCAAATTGTT ATTCAAATTT 2880 

TCATATCGCG TAATTTGTTG ACTTAATGAT CTGATATCTT CTTCAAGCTC TGATTCTTTT 2940 

AAAGATATGC TATCAACCTC ACTCGTATAA CGTGACACAA AATTaTCGCA AGCTTGCTTC 3 000 

GTTAAATCAC TCAATGTTTT CATACTTGTT GATAATGGAA TTAACACCGT ACTAAAAAAT 3060 

TGCTTAGCTG ACGTATACGC TTTCCCTTTA AGCGCATCAT CATTAATAAA TTGAGTAATT 312 0 

GCTTTTTCCA ACGCATCATA ATTTGAATTC ATTGTTTGAC TCAAATTCCC CACACTTGAA 3180 

GCTTGGTTTC GAGATCTGTC TAAATACATG TCAATACTCA TCGGCATGCT CCTTTTTCAA 3240 

AAATATATGA TTTTCAAACT ATTTAAAATC AAATGCTTTT TACATCTACA AAGTTGTAAA 3 3 00 

35 ATTTTAAAAC TCGGCGATGA TTATTTCTTA TGTAAAGGAG TCTAGATGCA GGTAAATTGA 3360 

GATAACATGT CGCCTTTTTT CTTATTTTAG CATATGGATA TAATGGTGTC TTTGTATATT 34 20 

CGCAATTAAT CAATAAAAAT TATCTTTCAA TATTTTAATT TTATTGCGAC AACATCCTTA 34 80 

40 ACATTAAATA TATTAATATC TCAAAATATA TTCACTATTA AAATATGTCA TCAGTTGTTA 354 0 

AAAGTATTTC CTCATCATGC GAAATATCAA AACGTATCTA AAATACGAAT AAGTTTATAC 3600 

AATCACACAA CATCATCATT CAAAATTTTA TTG 363 3 

45 

(2) INFORMATION FOR SEQ ID NO: 95: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2365 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



25 



30 



55 



575 



EP0 786 519 A2 



10 



1S 



20 



25 



30 



35 



40~~ 



45 



SO 



TGATACGAAt 


GCATTACAAT TCATATGCAA 


CATACAATTC 


CTTCTACAGC 


AAATGAAGTG " 


60 


AAACAAATAG 


TTGATGTGAC ATCTGTAGCA 


GAAAATGATA 


CGCATTAGTC 


ATAAAATTAA 


120 


ATGGAAATGT 


CGATGAAGTG 


TATCAGCAAT 


TACAGCGATT 


AATTAAGAAT 


GCTAATGTCG 


180 


AAGAGAGTGA 


GAATACTGAC 


AATATTAATA 


GTCAAGATAC 


AAGTTATACA 


CCTCAAGTAA 


240 


AAGTAACAAC 


ACCAATTTTA 


GTGAAAGCAC 


CAATCGCTGG 


TCGTCGTATT 


TTACTTAAAG 


300 


AAGTAAGAGA 


TTCAATTTTT 


AGAGAGAAAA 


TGGTAGGTGA 


AGGCTTAGCA 


ATCAAAGCTC 


360 


ATGAAGAATC 


CAAAGTAATC 


GCACCGTTCA 


ATGGTTTAAT 


ATCTATGATT 


GTACCAACTA 


420 


AGCATGCAGT 


TGGTATTCAA 


TCAGAAGACG 


GTGTGGACAT 


AGTCATTCAT 


ATTGGCGTGA 


480 


ATACAGTTGA 


CTTGGAAGGT 


AAAGGGTTCA 


AGTGCTTTGT 


AAAGCAAAAT 


GATCATGTTG 


54 0 


AAGCAGGGCA 


AACGTTGTTG 


CAATTCGACC 


AGCAATATAT 


ACAACAACAA 


GGCTACAATG 


600 


CTGACGTTAT 


TGTCGTTATT 


AGCAACTCTG 


CCGATTTAGG 


AAAAGTAGAA 


CTGACAATGA 


660 


ATGAAATCAT 


TACGACTGAA 


GATGTTATTT 


TTAAAATATT 


TAAAAACTAG 


GAGTGTGTTG 


720 


TAATAATGAC 


AAAATTACCG 


CAAAATTTCA 


TGTGGGGTGG 


CGCTCTTGCC 


GGAAATCAAT 


780 


TTGAAGGTGG ATATGATAAA GGTGGTAAAG 


GGTTAAGTGT 


AATTGATGTT 


ATGACGAGTG 


840 


GTGCACATGG 


CAAAGCACGT 


CAGATTACAG 


AATCTATAGA 


TCCCAATCAC 


TATTATCCAA 


900 


ATCATGAAGG 


TATTGATTTT 


TATCATCGTT 


ATAAGGAAGA 


TATTGCCTTG 


TTTAAAGAAA 


960 


TGGGATTGAA 


ATGTTTACGT 


ACGTCGATTG 


CGTGGACACG 


TATCTTTCCG 


AATGGGGATG 


1020 


AAGATGTGCC 


AAATGAAGAA 


GGACTCGCCT 


TTTATGATCG 


TATCTTTGAT 


GAATTAATTG 


1080 


CACAAGGTAT 


TGAACCTGTT 


GTGACGTTAT 


CACATTTTGA 


GATGCCACTT 


CATTTAGCGA 


1140 


AACATTATGG 


TGGATTTAGA 


AATAGAGAAG 


TTGTCGATTA 


TTTTGTGCAT 


TTTGCGCGTG 


1200 


TTGTATTTGA 


AAGATATAAA 


GATAAAGTTA 


CATATTGGAT 


GACGTTTAAT 


GAAATTAATA 


1260 


-ATCAGATGGA- 


CACATCAAAT ~ 


CCTATCTTTT ~ 


TATGGACGAA' 


TTCTGGGGTAGCATTGACAG 


1320 


AAAATGATAA 


TCCTGAAGAA GTCyTGTATC AAGTAGCACA TCATGAACTT TTAGCCAGTG 


1380 


CyTTAGCAGT 


TCGTCTTGGT 


AAAGaGATtA 


ATCCgAaGTT 


TAAGATTGGr 


ACmATGATTt 


1440 


CAmaTGTACC 


CmTTTATCCa 


TAwTCGTGTC 


ATCCGAAAGA 


TATGATGGAA 


GCACAAATTG 


1500 


CGAATCGCTT 


ACGTTTCTTT 


TTCCCGGATG 


TCCAAGTGAG 


AGGTTATTAT 


CCAAGCTATG 


1560 


CTAAAAAAAT 


GTTGGCACGA 


AAAGGATATG 


ATGTTGGATG 


GCAAGAAGGG 


GACGACAGTA 


1620 


TTTTACAGCA 


GGGCACGGTT 


GATTATATTG 


GCTTTAGTTA 


TTACATGTCT 


ACGGCTGTAA 


1680 


AACATGATGT 


TGATACTACA 


GTTGAAAACA 


ACATCGTCAA 


CGGTGGTTTG 


AATCATTCTG 


1740 



55 



576 



10 



EP 0 786 519 A2 

GATATACATT GAATGTGTTA TATGATCGTT ATCAGTTACC ACTTTTTATT GTGGAAAATG 1360 

GTTTTGGTGC AGTTGATGAA GTGGTAGATG GACATATTCa TGATGATTAT CGCATTGAAT 1920 

ATTTAAAAGC ACATATTACA GCAGCGATAG AAGCAGTTGA TCAAGATGGT GTAGATTTAA 1980 

TCGGTTATAC ACCGTGGGGA ATCATTGATA TTGTTTCATT TACAACCGGT GAAATGAAGA 204 0 

AACGCTATGG TTTAATATAT GTTGATCGAG ATAATGATGG TCATGGCACG ATGGAACGCT 2100 

TGAAAAAAGA TTCGTTCTAT TGGTATCAAC AAGTGATAGC AT CAAATGGA GATAAATTAT 216 0 

AAAGGTATAT TATAAGTATT TTAGGGTTAG AGCC CGAGAC ATAAATTAAT ATAGTAGGAC 22 20 

CTACAGTGTT ATAATGGCGG gCCCCCAACA CAAAGAATTT CGAAAAGAAA TTCtAcAGGT 22 8 0 

aATGCaAGtT GGCGGGGcCC AACACAGAGA AATTCGAAAA GAAATTCTAc AGGTAATGCA 234 0 

AGTTGGGGAA GGACAGAAAT AAATT 23 65 
20 (2) INFORMATION FOR SEQ ID NO: 96: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11050 base pairs 

(B) TYPE: nucleic acid . 
25 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



75 



(xi) SEQUENCE DESCRIPTION: i 

30 

CTG CGATACG ATTTGTTGAA AGTGGGGAAA 
AGGCATACGA AGCTTTGATT GGTAATAAAG 

3S CGCGACAAAA CATTAAATAT GTTTCTCCGT 

CTTTGCAAGG TTTGAAGGAG TTTAACTTAT 
TAAAXTAGAA CATGAACTAA AGGCATTAGC 

40 ACAACCATAT CAAAGTGAAT GTTTTGTCAG 
TTCGCCACAA GAAAGTAGCA ATATTTACTT 
TTACAATCAA AATGGAGATG TATATCGTTA 

45 

CAGTAACTTA TTTCATCCGA AAGAGGTTAA 
AGTTCTTGGA TTGCCTAGAG AATTGATGGC 
TTTGACACTT TTTGCATTAA TAAATGATAA 

50 

ATTAACAAGT AAATTTGCTA AAGATCGAAT 
AGTAGGATAC GATCAAGATG AATTTTATGA 

55 



IEQ ID NO: 96: 

ACAAAAAAGT TATCATTACC AATTTAGAGC 60 

GTACACACAT TCACATGTAG CACTTTATCA 120 

TGATTCAAAT GAAAAAGTTG TCTGCTGACA 180 

GACAGAAAAC TTTATTTTGG GTAGAAATAA 240 

AGATTACATT AATATACCAT ATAGTATATT 300 

ACATTATACG AAAGGCCAAG TTATTTATTT 360 

TTTAATTGAA GGTAACATTA TTAGAGAACA 4 20 

TTTTAATAAA GAGCAAGTAT TATTTCCAAT 4 80 

CGAATTGTGT ACAGCATTAA CCGATTGTAC 54 0 

CTTTTTGTGC AAAGCTAATG ATGATATATT 600 

TGAGCAGCAA CACATGAACT ATAACATGGC 6 60 

TATCAAATTG ATATGCCATC TATGTCAGAC 72 0 

AATCAAACAG TTTTTAACTA TTCAAC t CAT 780 



577 



IS 



900 
960 
1020 
1080 
1140 
1200 
1260 



1440 
1500 
1560 
1620 
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TGAAAAACTT GTTGTTAAAG ATCATAAAAA TTGGTTAGTA AGCAAACATT TATTCAATGA " 
TGTATGTGTT TAATATACAA TGTAAAATGA ATAAGTTGAA CATGAGGTCT AACGTACATT 
TATACGTTAG GCCTTTTTTG CTAGCATGAT GAATAATTTA AAATGTTAGT TAAATTTGAT 
TGTTGAAATT ACAGTAAAAT TTAAGGTGAT GAAAAATTTA GAACTTCTAA GTTTTTGAAA 
AGTAAAAAAT TTGTAATAGT GTAAAAATAG TATATTGATT TTTGCTAGTT AACAGAaAAT 
TTTAAGTTAT ATAAATAGGA AGAAAACAAA TTTTACGTAA TTTTTTTCGA AAAGCAATTG 
ATATAATTCT TATTTCATTA TACAATTTAG ACTAATCTAG AAATTGAAAT GGAGTAATAT 
TTTTGAAAAA AAGAATTGAT TATTTGTCGA ATAAGCAGAA TAAGTATTCG ATTAGACGTT 1320 
TTACAGTAGG TACCACATCA GTAATAGTAG GGGCAACTAT ACTATTTGGG ATAGGCAATC 1380 
ATCAAGCACA AGCTTCAGAA CAATCGAACG ATACAACGCA ATCTTCGAAA AATAATGCAA 
20 GTGCAGATTC CGAAAAAAAC AATATGATAG AAACACCTCA ATTAAATACA ACGGCTAATG 

ATACATCTGA TATTAGTGCA AACACAAACA GTGCGAATGT. AGATAG CACA ACAAAACCAA 
TGTCTACACA AACGAGCAAT ACCACTACAA CAGAGCCAGC TTCAACAAAT GAAACACCTC 
25 AACCGACGGC AATTAAAAAT CAAGCAACTG CTGCAAAAAT GCAAGATCAA ACTGTTCCTC 1680 

AAGAAGCAAA TTCTCAAGTA GATAATAAAA CAACGAATGA TGCTAATAGC ATAGCAACAA 1740 
ACAGTGAGCT TAAAAATTCT CAAACATTAG ATTTACCACA ATCATCACCA CAAACGATTT 1800 
CCAATGCGCA AGGAACTAGT AAACCAAGTG TTAGAACGAG AGCTGTACGT AGTTTAGCTG i860 
TTGCTGAACC GGTAGTAAAT GCTGCTGATG CTAAAGGTAC AAATGTAAAT GATAAAGTTA 1920 
^ CGGCAAGTAA TTTCAAGTTA GAAAAGACTA CATTTGACCC TAATCAAAGT GGTAACACAT 1980 

TTATGGCGGC AAATTTTACA GTGACAGATA AAGTGAAATC AGGGGATTAT TTTACAGCGA 2040 
aGTTACCAGA TAGTTTAACT GGTAATGGAG ACGTGGATTA TTCTAATTCA AATAATACGA 2100 

-40 TGGGAATTGG-AGACATTAAA- AGTACGAATG GCGATGTTGT "AGCTAAAX^ A^TATGATA 216~6 

TCTTGACTAA GACGTATACA TTTGTCTTTA CAGATTATGT AAATAATAAA GAAAATATTA 2220 
ACGGACAATT TTCATTACCT TTATTTACAG ACCGAGCAAA GGCACCTAAA TCAGGAACAT 2280 
45 ATGATGCGAA TATTAATATT GCGGATGAAA TGTTTAATAA TAAAATTACT TATAACTATA 2340 

GTTCGC CAAT TGCAGGAATT GATAAACCAA ATGGCGCGAA CATTTCTTCT CAAATTATTG 2400 
GTGTAGATAC AGCTTCAGGT CAAAACACAT ACAAGCAAAC AGTATTTGTT AACCCTAAGC 24 60 

SO 

AACGAGTTTT AGGTAATACG TGGGTGTATA TTAAAGGCTA CCAAOATAAA ATCGAAGAAA 2520 
GTAGCGGTAA AGTAAGTGCT ACAGATACAA AACTGAGAAT TTTTGAAGTG AATGATACAT 2580 

55 



578 
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ACCAATTTAA 


AAATAGAATC 


TATTATGAGC 


ATCCAAATGT 


AG CT AGT ATT 


AAATTTGGTG 


2700 




ATATTACTAA 


AACATATGTA 


GTATTAGTAG 


AAGGGCATTA 


CGACAATACA 


GGTAAGAACT 


2760 


5 


TAAAAACTCA 


GGTTATTCAA 


GAAAATGTTG 


ATCCTGTAAC 


AAATAGAGAC 


TACAGTATTT 


2820 




TCGGTTGGAA 


TAATGAGAAT 


GTTGTACGTT 


ATGGTGGTGG 


AAGTGCTGAT 


GGTGATTCAG 


2880 


10 


CAGTAAATCC 


GAAAGACCCA 


ACTCCAGGGC 


CGCCGGTTGA 


CCCAGAACCA 


AGTCCAGACC 


2940 


CAGAACCAGA 


ACCAACGCCA 


GATCCAGAAC 


CAAGTCCAGA 


CCCAGAACCG 


GAACCAAGCC 


3000 




CAGACCCGGA 


TCCGGATTCG 


GATTCAGACA 


GTGACTCAGG 


CTCAGACAGC 


GACTCAGGTT 


3060 


15 


CAGATAGCGA 


CTCAGAATCA 


GATAGCGATT 


CGGATTCAGA 


CAGTGATTCA 


GATTCAGACA 


3120 




GCGACTCAGA 


ATCAGATAGC 


GACTCAGAAT 


CAGATAGTGA 


GTCAGATTCA 


GACAGTGACT 


3180 




CGGACTCAGA 


CAGTGATTCA 


GACTCAGATA 


GCGATTCAGA 


CTCAGATAGC 


GATTCAGACT 


3240 


20 


CAGACAGCGA 


TTCAGATTCA 


GACAGCGACT 


CAGATTCAGA 


CAGCGACTCA 


GACTCAGATA 


3300 




GCGACTCAGA 


CTCAGACAGC 


GACTCAGATT 


CAGATAGCGA 


TTCAGACTCA 


GACAGCGACT 


3360 




CAGACTCAGA 


CAGCGACTCA 


GACTCAGATA 


GCGACTCAGA 


TTCAGATAGC 


GATTCAGACT 


3420 


25 


CAGACAGCGA 


CTCAGATTCA 


GATAGCGATT 


CGGACTCAGA 


CAGCGATTCA 


GATTCAGACA 


3480 




GCGACTCAGA 


CTCGGATAGC 


GATTCAGATT 


CAGATAGCGA 


TTCGGATTCA 


GACAGTGATT 


3540 


30 


CAGATTCAGA 


CAGCGACTCA 


GACTCGGATA 


GCGACTCAGA 


CTCAGACAGC 


GATTCAGACT 


3600 


CAGATAGCGA 


CTCAGACTCG 


GATAGCGACT 


CGGATTCAGA 


TAGCGACTCA 


GACTCAGATA 


3660 




GTGACTCCGA 


TTCAAGAGTT 


ACACCACCAA 


ATAATGAACA 


GAAAGCACCA 


TCAAATCCTA 


3720 


35 


AAGGTGAAGT 


AAACCATTCT 


AATAAGGTAT 


CAAAACAACA 


CAAAACTGAT 


GCTTTACCAG 


3780 




AAACAGGAGA 


TAAGAGCGAA 


AACACAAATG 


CAACTTTATT 


TGGTGCAATG 


ATGG CATT AT 


3840 




TAGGATCATT 


ACTATTGTTT 


AGAAAACGCA 


AGCAAGATCA 


TAAAGAAAAA 


GCGTAAATAC 


3900 


40 


ttttttaggc 


CGAATACATT 


TCTATTCGGT 


TTTTTTGTTG 


AAAATGATTT 


TAAAGTGAAT 


3960 




TGATTAAGCG 


TAAAATGTTG 


ATAAAGTAGA 


ATTAGAAAGG 


GGTCATGACG 


TATGG CTT AT 


4020 




ATTTCATTAA ACTATCATTC ACCAACAATT 


GGTATGCATC 


AAAATTTGAC 


AGTCATTTTA 


4080 


45 


CCGGAAGATC 


AAAGCTTCTT 


TAATAGCGAT 


ACAACTGTTA 


AACCATTAAA 


AACTTTAATG 


4140 




TTGTTACATG 


GATTATCAAG 


TGATGAAACG 


ACATATATGA 


GATATACAAG 


CATAGAAAGG 


4200 


50 


TATG CGAATG 


AACACAAATT 


AGCTGTGATT 


ATGCCCAATG 


TGGATCATAG 


CGCATATGCT 


4260 


AACATGG CAT 


ATGGTCATAG 


CTATTATGAT 


TATATTTTGG 


AAGTGTATGA 


TTATGTTCAT 


4320 




CAAATATTTC 


CACTTTCCAA 


AAAGCGTGAT 


GACAATTTTA 


TAGCAGGTCA 


CTCTATGGGA 


4380 
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TTATCTGCTG TGTTTGAAGC GCAAAATTTA ATGGATCTAG AGTGGAATGA TTTTTCAAAA ~ 450( 

GAGGCCATAA TTGGCAATCT TTCAAGTGTT AAAGGAACTG AACATGATCC G T ATTACTTG 456c 

CTAGACAAAG CTGTAGCTGA AGATAAACAA ATTCCAAAAT TGCTCATTAT GTGTGGTAAA 462 C 

CAAGACTTTT TATATCAAGA CAACTTAGAT TTTATCGATT ATTTATCACG CATAAATGTT 468c 

CCTTATCAAT TTGAAGATGG ACCAGGAGAT CATGATTATG CATATTGCGA TCAAGCGATT 4 7 4C 

AAGCGTGCTA TAACATGGAT GGTGAATGAT TAATTATTTC TTGGAAAATA TGTGGCTGCA 48 00 

TTAAATACAC AG AG TG AG AG ATACAAACTA TTTACGCACG ACTAACATTT CTAAGTGTTT 4860 

, 5 AAATTATTTT TGTATTAATA TGATTGGCGC AATTTGCTGA TACACAAAAA TGTTTCTCGT 4 920 

GAAACTTAGA TTTAGCTTAT AGTTTTATCA TCATTTGTAT GACTTACATT ATAAATTTTA 4 980 

TTATAATGAG GTTAACGCTT TGAAAGGAGT CATCATCATG TCGACCAATA AAAACGATTA 5040 

20 TGAGCATATG TTGTTTTATT TTGCATATAA AACCTTTATT ACTACCGCTG ATGAAATTAT 5100 

AGAGAAGTAT GGTATGAGTC GTCAGCATCA TCGTTTTTTG TTTTTTATCA ATAAATTACC 5150 
TGGTATTACT ATT AAAT CAT TACTAGAAAT ATTAGAAATT TCTAAmCAAG GATCACATGC 
AACACTTCAA AAATTAAAAG AGCAAGGTCT CATTATTGAA AAAGTTTTAG AGACTGATCG 
ACGTGTCAAA AAATTATATT CGACGGATAA AGGCGATCAA CTCATTGCTG AATTGAACAA 
GGCGCAAGAT GAATTATTGC AAAATATATA TCAACAAGTC GGTTCGGATT GGTATGATGT 

GATGGAAGCA TTGG CTAAAG GgCGACCTGG cTTTGATTTT ATTAAGCATT TGAAAGATGA 5460 

AAAAGAAAGC TAGCATCAGA AATGTTAAAA ATCTTCGCAT TCTTAAATTT AAAAAATATG 5520 

3S TCAAAAAGTG TATAATAAAA ACATATAATT TAATTGAACT CAGTTTCAAC ACATCTTAGA 5580 
AAGGAGTTTG AATGATGAAA AAATTAGCAG TTATTTTAAC ATTAGTTGGC GGTTTATACT 
TCGCATTTAA AAAATACCAA GAACGTGTTA ACCAAGCACC TAACATTGAG TACTAAATTA 

40 AACCATAAAA--AArrCCCGAA— CACCITGTTA~TA 576(F 

TGAATATATC AAATATTATT TTTGCGCTTT CTGTATTTTC GATATTACCA CTAAATGATT 5820 

CTGATCTAGG TCOGTAAGCG TAgGTATTAA CATCCTCGCC TGTATGTCCA TCGGAAGTCC 5880 

ACCCTGTATA AGATTTATCA TTTACTGGCT TCTGAATAGC GTGTTGTAGG GCTTTTGTTT 5 94 0 

GCGTTTCTAC TTCTG CGG AT TTTTCGTCTT TTT CTrri ' l ' T AAGTAGTCTT TTTAGCTTTT 6 000 

TATTCTCTTT TTTAACCTTT TTCATATCAT CTTGTGAAAA TTCAAATCCA TAACCTTCAT 6 060 

TAATAACTTT TTCAGGGTCT TCACCTTTAG CCATTTTTTC TGTCATATAT GATCCAGAGT 6120 

GTTTCATAGA TTTAATCGGT TGAGGATTCC ATTCGTATCC TTTATCTTTA CCAATTGTTA 6180 
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ATTGAATGGC GTCATCGAAT GCTTTTTCAA AAC CTTC CAT TTCAGACATA ACGCCTGTAA " 6300 

TATCGTTGGA ATGCGCTGAT TTATCTATAG AAGCACCTTC GACCATTAAA AAGAATCCTT 6360 

TTTTATTGCG CTCAAGCTTA CTAAGTGCAC TTTGTTGCAT ATCAGCTAAT GATGGTTCGT 6420 

CTTTAGAAGC ATCTATTGCA AGTGGCATAT TTTTATCTGC AAACAAACCA AGAACTTTAT 64 80 

CTTT AT CAG A TTTTGATAAC TCCTTACTGT TCGTGGCAAG GTCGTAACCA TCTTTTTTGA 654 0 

ATTTTTTATC TAAATTGCCA TTACTTTTAC CGAAATATTT AGCGCCGCCG CCTAATAAAA 6600 

CATCAACTTT ATGCTTTCCG TTGATTTTAT CTTTATAAAA TTGTTT AG CG ATTTCGTTTT 6660 

TATCATCTCT AGAAGTCACG TGTGCAGCAT ATGCTGCTGG TGTTGCATCT GTTAATTCAG 6 720 

CTGTTGAAAC AAGACCAGTC GACTTACCTT TTTCTTTTGC ACGTTCAAGC ACCGTCTTTA 6780 

CTTTCTGCTT GTTACTGTCA ACACCGATGG CACCATTATA TGTCTTATGA CCAGAACTAA 6 84 0 

AGGCTGTTCC GCCAGCTGCA GAATCAGTAA TATTCTGTTT TGGGTCATTT GAATATGTAC 6 900 

GATTTGTGCC TTTTAAATAT GAATCAAAAG CAGTAGGGGT CATTTCTTTA GCATGCGGAT 6 960 

CATTTTTATA ATAACGATAA GCTGTGTTAA ATGATGGACC CATGC CATCG CCAACTAAAA 7 020 

25 AGATAACATT TTTTGGATTT TTAGTATTAC CAACCGCGAA ACTTTCATCT TTAGAACTTT 7080 

TATCGGATTG CGCAATTGCA GGTGTGACAG AACTAAAAAC CGTTGACACG ATAATAAGGT 714 0 

TAGCAACTGC AAATTTTGTG GCTTTTTTAA CTGATAACAT AAGACATCCT CCTGAGTATA 7200 

TGACTATGTC TTCAGTGTAA AAGAGGAATT Tt GAGCAATT ATGTAGTTTT AGTTAnAAAT 7260 

ATGTAAACAG AGTGATTTAG AATAACAAAA aATGAATATA TATGACAATT TGTTATAGAA 7320 

AGCGTTAGAA TAGAAGCGTG TGAAAATATA GAATTAAATA TAATTTGAGG TGGAAAAATG 73 80 

ATACTAGTAA TGTTATCTCC ATTATTAATC ATATTCTTTA TAGTGTTGTC TATTTTAGAA 744 0 

GAGCGTAAAC GTACGAAGAA AAAGCAACTC GAGAAAGAAA AAGCAAATAC ACTAAATCAA 7500 

40 AATACAAATG ACACGGAAAG TTCAAATCAA GAGCCGTCAT TGCAGCAGGA TAAAGAACAA 7560 

AAAGATAACA AAGGATAATT CAATTGAAGG AAGAAGATTA TAGATGAAAA TATTAATTGT 7620 

TGAAGATGAT TTTGTTATAG CAGAGAGTTT AGCATCTGAA CTTAAAAAAT GGAATTACGG 7 680 

TGTTATTGTC GTTGAACAAT TTGATGATAT ACTGTCTATC TTTAACCAAA ATCAACCTCA 774 0 

GCTTGTATTG CTAGATATTA ATTTGCCAAC GTTAAATGGT TTTCATTGGT GTCAAGAAAT 7 800 

CCGAAAAACA TCTAATGTGC CAATTATATT TATTAGTTCC CGTATTGATA ATATGGACCA 7 860 

AATTATGGCA ATACAAATGG GGGGAGATGA TTTTATCGAA AAGCCATTTA ACTTGTCATT 7 920 

AACGATTGCC AAAATTCAAG CATTATTGAG ACGAACTTAT GACTTGTCAG TAGCTAATGA 7 980 
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ACAAAACATA CAGCTATCTT TGACTGAATT ACAAATATTA AAGTTATTAT TTCAAAATGA " 8100 

AGaTAAATAT GTAAGTAG r A CTGCTTTAAT TGaAAAATGT TGGGaATCAG AAAACtTCAT 8160 

AGATGATAAC ACATTAGCTG TTAACATGAC GCGCCTGCTG AAAAAATTAA ATACTATTGG 8220 

CGTTAATGAT TTTAT CATT A CAAAGAAAAA TGTCGGATAT AAAGTATAGG GTGAATGCAA 8280 

TGACCTTTCT TAAAAGTATT ACTCAGGAAA TAGCAATAGT CAT AG TT ATT TTTGCTTTGT 834 0 

TTGGCTTAAT GTTTTACCTG TATCATTTGC CATTAGAAGC ATATTTACTA GCACTTGGCG 84 0 0 

TTATTTTATT ATTATTACTC ATATTCATAG GTATTAAATA TTTAAGTTTT GTAAAAACTA 84 6 0 

TAAGCCAACA ACAACAAATT GAAAACTTAG AAAATGCGTT GTATCAGCTT AAAAATGAAC 852 0 

AAATTGAATA TAAAAATGAT GTAGAGAGCT ACTTTTTAAC ATGGGTACAT CAAATGAAAA 8580 

CACCCATTAC TGCAGCACAA CTGTTACTTG AAAGAGATGA GCCTAATGTT GTTAATCGTG 864 0 

20 TTCGTCAAGA GGTTATTCAA ATTGaTAACT ATACAAGTTT AGCACTTAGT TATTTAAAGT 8700 

TATTAAATGA AACTTCTGaT ATTTCTGTCA CTAAAATTTC GATTAATAAT ATCATTCGCC 8760 

CAATTATTAT GAAATATTCA ATACAGTTTA TTGATCAAAA AACAAAAATC CATTATGAAC 8820 

CTTGTCATCA CGAAGTATTA ACTGACGTTA GATGGACCTC TTTAATGATA GAACAATTAA 8880 

TAAATAATGC ACTTAAGTAT GCGAGAGGTA AAGATATATG GATTGAATTT GATGAGCAAT 8 94 0 

CCAATCAATT ACACGTAAAA GATAATGGTA TCGGTATTAG TGAAGCGrAC TTGCCTAAAA 9000 

TATTTGATAA GGGCTATTCA GGTTATAATG GCCAGCGCCA AAGTAACTCA AGTGGGaTTG 9060 

G TTT ATTTAT CGTAAAACAA ATTTCAACAC ACACAAACCA TCCTGTTTCA GTCGTATCTA 9120 

AACAAAATGA GGGTACAACA TTTACGATTC AATTTCCAGA TGAATAAAAA CTTTCAATAT 9180 

TGTAAGTATA CTAGTAACAT TTTTTTACTA ATTTAAATGT TATTAGTATT TTTTTGTTTT 9240 

AATATAGAAC TAACAAAGAA ATGAGGTGCA TGCCATGTTG CTAGAAGTGn AACATGTAAA 9300 

40 -AAAGGTTTAT^GGTAAAGGTT TGAATGCTAC~GACAGCACTT AATCAAATGA"ATTTATCAGT 9360" 

TGGAGCTGGT GaATTTGTTG CaATTATGGG TGAGTCTGGG tCAGGGAAGT CTACACTACT 9420 

AAATTTAATT GCtTCTTTTG ATGGACTAAC TGAAGGTGAC ATTATTGTGG ATGGCGCACA 94 80 

TTTAAATAAT ATGAAAAATA AAAGTAAAGC ATTGTATCGT CaACAAATGG TAGGTTTTGT 954 0 

TTTTCAAGAT TTTAATCTTT TACCAACAAT GACGAATAAA GAAAATATAA TGATGCCATT 9600 

AATTTTAGCT GGTGCTAAAC GAAAAGATAT AGAACAAAGG GTACATCAGT TGGCAGTACA 9660 

ATTACATTTA GAGGGATTCT TAAACAAGTA TCCTTCTGAA ATCTCTGGGG GTCAGAAGCA 9720 

ACGCATTGCC ATTGCACGTG CATTAGTTAC TAAGCCGACG ATTTTACTAG CCGATGAACC 9780 
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TCAATTGGAA 


CAGACAATTT 


TAATGGTAAC 


TCATTCAAAT 


AT CGATGCGT 


CTTATGCAGA 


GCGAGTCATT 


TTTATTAAAG 


ATGGGCGTCT 


ATATCATGAA 


ATATATCGTG 


GTGAAGAAAG 


TCAATTAGCT 


TTTCAACAAC 


GAATAACAGA 


TAG CTTAGCA 


CTTGTGAATG 


GAGGAAGTGT 


CAATATATGA 


AGTTAAGATT 


GTTATGnACA 


TAGTGCGACG 


TCAATTTATT 


ACGCAGCGAC 


TTGTAATCAT 


TCCATTCATT 


TTAGCGGTAA 


GTGTACTATT 


CATGATTGAA 


TATACGCTTG 


TGTCAATTGG 


GTTAAATAGC 


TACATAAAAC 


AGAAGAATGA 


CTTCCTAGTA 


CCATTTATTA 


TCATAGCTAA 


rrrrriTATG 


GCGCTTTTAA 


CTTTTATTTT 


TATTTTCTAT 


GCAAATCACT 


TTATGATGTC 


ACAAAGACGA 


AAAGAGTTTA 


GCATTTTTAT 


GACATTGGGC 


ATGACCAAGA 


AAAGTATGCG 


TTTAATTGTA 


GTGATGGAAA 


CTATCTTACA 


ATTTGTGATA 


ATTTCAGTCG 


TTAGTATTGC 


CGGCGGATAC 


TTACTTGGTG 


CGATATTTTT 


CTlVriTATA 


CAGAAAATAA 


TGGGCAGTGA 


AGTTGCGACG 


TTAAGGTATT 


ATCCATTTGA 


CTCTGTAGCG 


ATGTTTATTA 


CTTTGATTAT 


CATTGCTGTA 


TTAATGGGCA 


TGCTACTTAT 


ATTCAACTTG 


TTTAGTATTA 


ATTTTCAACG 


GCCGATAACT 


TATCAACATC 


GTTCCGATTC 


TAGTGTCATA 


TCACGATGGT 


TGCGTTACGT 


TTTAATTGTT 


ATAGGAAGCG 


CAnACTATAT 


TTAGGTTACT 


TTATTGCATT 


ACAACAAGAT 


ACGACGTTTG 


GTGCCTTTTT 


TAAAATATGG 


ATTGTCATAG 


GATTAGTTAT 


TATCGGTACT 


TATGCATTTT 


TTGTAGGTAT 


AAGTGAAATA 


ATT ATTAGT A 


TATTGCAGCA 


GGTATCAAAA 


GTTTACTATC 


ATCCACGGTA 




GTAGTTGGGA 


TGCGTGTACG 


TCTTAAAATG 


AATGCAGTCA 


GTCTTGCAAC 


AATCACTTTG 


CTGTGTACAT 


TTTTGATTGT 


AACGCTCACA 


ATGACATTAA 


CAACCTATCG 


TGATATGAAT 


CATACCATTA 


CGAAATTGAT 


TACGAATGAT 


TakGATTTGT 


CATTTAGCGA 


CAATTCTAAG 


TCACAAaTAG 


AACGTCAACA 



AACAATTGAG 

(2) INFORMATION FOR SEQ ID NO: 97: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 983 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 97: 
CGACATAACG AGGCAAGGGT ACATGATACT TTAGCCTCGT TTTTGATATO TATTTTTCTG 
AATATAAGGG CAATAGATGG TATTTTATAw TTTTTTTAAG GTAGTGATTA ACATAGATAT 
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TCAAGCGGAA CAGCATTATG CACCAGTATT AACGCATTTT TTAGATCCAA GAGGGCAATA 

TATATTGGAA GTGATTTGTG GCAGTTATGA AGATTTAAAC GTATCTTTTT ATGGTGGACC 

TAATGCTGAA AGAAAAAGAG CAATCATTTC GCCGAACTAT TATGAACCTA AAGAAAGCGA 

CTTTGAATTA ACTTTAATGG AAATAGATTA TCCTGAAAAA TTCGTCACTT TAAAACATCA 

ACATATTTTA GGGACATTAA TGTCTTTAGG TATCGAACGC GAACAAGTTG GAGATATAAT 

TGTG aATGAA CGAATTCAAT TTGTTTTGAC AAGTAGATTG GAATCATTTA TTATGTTAGA 

ATTACAACGT ATTAAAGGCG CATCAGTTAA ACTTTATACT ATTCCAGTAA CAGATATGAT 

ACAATCTAAT GAGAATTGGA AAAATGAAAG TGCaCAGTTA GTTCTTTAAG GTTAGATGTT 66 0 

GTTATTAAAG AAATGATACG TAAATCACGT ACGATTGCGA AACAACTAAT CGAAAAAAAA 720 

CGTGTTAAAG TGAATCACAC TATTGTTGAT TCAGCAGATT TTCAATTACA AGCAAATGAT 

20 TTAATATCCA TCCAAGGTTT TGGTAGAGCA CACATTACTG ACTTAGGTGG TAAAACTAAA 

AAAGATAAAA CGCACATTAC CTATAGAACA TTATTCAAAT AG T AATGATT TAAGGAGGAT 

AACAAATGCC TTTTACACCA AATGAaATTA AGAATAAAGA GTTTTCACGT GTaAAGAATG 

25 GTTTTAGAAC CTACTGnAGT TGG 

(2) INFORMATION FOR SEQ ID NO: 98: 

(i) SEQUENCE CHARACTERISTICS: 
30 (A) LENGTH: 10322 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

35 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 98: 
TTTTGCAAAG CTTATTTTAT GTCAAACAGA TAGTCAATGT GAAACAAAGG TTAGTACATA 60 
-40 TAATCATGCA~GACTTTATGT ATATATCAAC~ AACTGAGAAT~GCAATT^ ~ ~~ 120~ 

TGAACAACTT GTGCGTCATA TGAATCAACT TCCTATAGAA AG CACAAATA AAGTGTACAT 180 

CATTGAAGAC TTTGAAAAGT TAACTGTTCA AGGGGAAAAC AGTATCTTGA AATTTCTTGA 240 

AGAACCACCG GACAATACGA TTGCTATTTT ATTGTCTACA AAACCTGAGC AAATTTTAGA 3 00 

CACAATCCAT TCAAGGTGTC AGCATGTATA TTTCAAGCCT ATTGATAAAG AAAAGTTTAT 36 0 

AAATAGATTA GTTGAACAAA ACATGTCTAA GCCAGTAGCT GAAATGATTA GTACTTATAC 420 

TACGCAAATA GATAATGCAA TGGCTTTAAA TGAAGAATTT GATTTATTAG CATTAAGGAA 4 80 

AT CAGTT AT A CGTTGGTGTG AATTGTTGCT TACTAATAAG CCAATGGCAC TTATAGGTAT 54 0 
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GAATGGTTTC TTCGAAGATA TCATACATAC AAAGGTAAAT GTAGAGGATA AACAAATATA $60 

TAGTGATTTA AAAAATGATA TTGATCAATA TGCGCAAAAG TTGTCGTTTA ATCAATTAAT - 720 

TTTGATGTTT GATCAACTGA CGGAAGCACA TAAGAAATTG AmTCAAAATG TAAATCCAAC 78 0 

GCTTGTATTT GAACAAATCG TAATTAAGGG TGTGAGTTAG ATGCCAAATG TAATAGGTGT 84 0 

TCAGTTTCAA AAAGCGGGAA AATTAGAATA TTATACACCT AATGATATAC AAGTAGATAT 900 

AGAAGACTGG GTAGTTGTCG AATCTAAAAG AGG CAT AG AG ATAGGTATTG TTAAAAATCC 96 0 

ATTAATGGAT ATTGCTGAAG AGGATGTTGT GTTACCTCTT AAAAATATTA TTCGCATTGC 1020 

T5 TGATGACAAA GATATTGATA AATTTAATTG TAATGAACGA GATGCTGAAA ATGCATTAAT 1080 

ACTATGTAAA GACATTGTAA GAGAACAAGG TTTGGACATG CGTTTAGTCA ATTGCGAATA 114 0 

TACATTAGAT AAATCGAAAG TTATTTTTAA TTTTACGGCG GATGATCGTA TTGATTTTAG 1200 

20 AAAATTAGTA AAAATATTAG CGCAACATTT AAAAACACGT ATCGAGTTGA GACAAATTGG 126 0 

TGTAAGGGAT GAAGCCAAAT TGCTTGGCGG TATCGGACCT TGTGGTAGGT CGTTATGTTG 1320 

TTCTACATTT TTAGGGGATT TTGAACCAGT ATCGATTAAG ATGGCTAAGG ATCAAAATTT 13 80 

ATCATTAAAT CCAACTAAAA TTTCTGGTGC ATGTGGTCGT TTGATGTGTT GTTTAAAATA 144 0* 

TGAAAATGAC TATTATGAGG AAGTACGTGC ACAATTACCT GATATTGGTG AAGCAATTGA 1500 

AACGCCTGAT GGTAACGGGA AAGTAGTTGC TTTAAATATA TTAGACATTT CTATGCAGGT 1560 

GAAGCTTGAG GGACATGAAC AGCCACTTGA ATATAAATTA GAAGAAATAG AAACTATGCA 1620 

TTAAGGAGGC ATTATTACAT TTGGATCGCA ATGAAATATT TGAAAAAATA ATGCGTTTAG 1680 

35 AAATGAATGT CAATCAACTT TCAAAGGAAA CTTCAGAATT AAAGGCACTT GCAGTTGAAT 174 0 

TAGTAGAAGA AAATGTAGCG CTTCAACTTG AAAATGATAA TTTGAAAAAG GTGTTGGGCA 1800 

ATGATGAACC AACTACTATT GATACTGCGA ATTCAAAACC AGCAAAAGCT GTGAAAAAGC 1860 

CATTACCAAG TAAAGATAAT TTGGCTATAT TGTATGGAGA AGGATTTCAT ATTTGTAAAG 1920 

GCGAATTATT TGGAAAACAT CGACATGGTG AAGATTGTCT GTTCTGTTTA GAAGTTTTAA 1980 

GTGATTAATC AAGCACACTC AAATAGTGTT ATAATTATAA ATGAATATGG TTTGGATAAG 204 0 

TCTGAGACAA TGCATGTTTC AGGCTTTAAT TGTGTATAAA GTTTTGGTGA TTGCATAAGA 2100 

GATGGCGGTA CTAAATGTTA TTATTAAGTG TGCACGCAgT ATCaTTAGTT ATAAAATGTA 2160 

GCTGTTAAAA GTCAAAAATA CATCGAATGT AGTTAGGCAT ATAATATAAA AAGAGTTTTC 2220 

AATTACTCAA TAGAAAAAGG TTGTCTTCAT AGGAGTTAAA AATGTTAAAA GAGAATGAAC 2280 

GATTTGATCA ACTAATCAAA GAAGATTTTA GTATTATTCA AAATGATGAT GTTTTTTCAT 234 0 
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TGGACTTATG TTCAGGCAAT GGGGTGATAC CCTTGTTATT GTTTGCGAAA CATCCACGAC 
ATATAGAAGG TGTTGAGATT CAAAAAACAC TTGTCGATAT GGCGCGACGC ACATTTCAAT 
TCAATGATGT TGATGAATAT TTAACAATGC ATCACATGGA TTTGAAAAAC GTTACTAAAG 

TATTTAAACC TTCACAATAT ACTTTAGTAA CGTGTAATCC GCCTTATTTT AAAGAGAATC 264 0 

AGCAACACCA ACATCAAAAA GAAG CACATA AGATAGCGAG ACATGAGATT ATGTGTACAC 2 700 

TTGAAGATTG CATGATTGCA GCCCGTCATT TATTAAAAGA AGGTGGCAGG CTAAACATGG 2760 

TACATCGTGC AGAGAGACTA ATGGATGTCT TGTTTGAAAT GAGAAAAGTG AATATTGAAC 2820 

l5 CTAAGAAAGT CGTTTTTATA TATAGTAAAG TAGGGAAATC AGCACAAACG ATAGTAGTAG 2880 

AAGGTCGAAA AGGTGGAAAT CAAGGTTTAG AAATCATGCC CCCATTTTAT ATTTATAATG 2940 

AAGATGGTAA TTATAGCGAA GAAATGAAGG AAGTATATTA TGGATAGTCA TTTTGTATAT 3000 

20 ATTGTAAAAT GTAGTGATGG AAGTTTATAT ACAGGATACG CTAAAGACGT TAATGCACGT 3060 

GTTGAAAAAC ATAACCGAGG TCAAGGAGCC AAATATACGA AAGTAAGACG TCCGGTGCAT 3120 

TTAGTTTATC AAGAAATGTA TGAGACAAAG T CTG AAG CAT TGAAGCGTGA ATATGAAATT 3180 

AAAACTTATA CCAGACAAAA GAAATTGCGA TTAATTAAGG AGCGATAGTA TGGCTGTATT 324 0 

ATATTTAGTG GGGACACGAA TTGGTAATTT AGCAGATATT ACTTATAGAG CAGTTGATGT 3300 

ATTGAAACGT GTTGATATGA TTGCTTGTGA AGACACTAGA GTAACTAGTA AACTGTGTAA 3360 

TCATTATGAT ATTCCAACTC CATTAAAGTC ATATCACGAA CATAACAAGG AT AAG CAGAC 342 0 

TGCTTTTATC ATTGAACAGT TAGAATTAGG TCTTGACGTT GCGCTCGTAT CTGATGCTGG 34 80 

3S ATTGCCCTTA ATTAGTGATC CTGGATACGA ATTAGTAGTG GCAGCCaGAG AAGCTAATAT 3540 

TAAAGTAGAG ACTGTGCCTG GACCTAATGC TGGGCTGACG GCTTTGATGG CTAGTGGATT 3600 

ACCTTCATAT GTATATACAT TTTTAGGATT TTTGCCACGA AAAGAGAAAG AAAAAAGTGC 3660 

40 TGTATTAGAG CAACGTATGC ~ATGAAAATAG~CACATTAOT 3720 

TGTGACAGAT ACATTAAAAA CAATTGCAAA GATAGATGCA ACACGACAAG TATCACTAGG 3780 

GCGTGAATTA ACTAAGAAGT TCGAACAAAT TGTAACTGAT GATGTAACAC AATTACAAGC 3840 

ATTGATTCAG CAAGGCGATG TACCATTGAA AGGCGAATTC GTTATCTTAA TTGAAGGTGC 3900 

TAAAGCGAAC AATGAGATAT CGTGGTTTGA TGATTTATCT ATCAATGAGC ATGTTGATCA 3960 

TTATATTCAA ACTTCACAGA TGAAACCAAA ACAAGCTATT AAAAAAGTTG CTGAAGAACG 4020 

ACAACTTAAA ACGAATGAAG TATATAATAT TTATCATCAA ATAAGTTAAT CACTTTATCG 4 080 

ATTaTATGAA ATTTTAAACG ATTTTATAAA CGCAAGCTGT AATTTTAAAT GGTAAGTTAT 4140 
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GTTTTTTAAT 


GTAAAATAAA 


TACATTGAAA 


GTAATAAATA 


CCTTAACATT 


GAATAAGATG 


4260 


AAAATGAGAT 


GACGAGATAA 


ATGTTCGCGT 


CCGTTGAAAT 


GCATAGAAAT 


CTTAGATATT 


4320 


ATTTGAAGTG 


AGACATTACG 


AGGAGGAACA 


GTTATGGCTA 


AAGAAACATT 


TTATATAACA 


4380 


ACCCCAATAT 


ACTATCCTAG 


TGGGAATTTA 


CATATAGGAC 


ATGCATATTC 


TACAGTGGCT 


4440 


GGAGATGTTA 


TTGCAAGATA 


TAAGAGAATG 


CAAGGATATG 


ATGTTCGCTA 


TTTGACTGGA 


4500 


ACGGATGAAC 


ACGGTCAAAA 


AATTCAAGAA 


AAAGCTCAAA 


AAGCTGGTAA 


GACAGAAATT 


4560 


GAATATTTGG 


ATGAGATGAT 


TGCTGGAATT 


AAACAATTGT 


GGGCTAAGCT 


TGAAATTTCA 


4620 


AATGATGATT 


TTATCAGAAC 


AACTGAAGAA 


CGTCATAAAC 


ATGTCGTTGA 


GCAAGTGTTT 


4680 


GAACGTTTAT 


TAAAGCAAGG 


TGATATCTAT 


TTAGGTGAAT 


ATGAAGGTTG 


GTATTCTGTT 


4740 


CCGGATGAAA 


CATACTATAC 


AGAGTCACAA 


TTAGTAGACC 


CACAATACGA 


AAACGGTAAA 


4800 


ATTATTGGTG 


GCAAAAGTCC 


AGATTCTGGA 


CACGAAGTTG 


AACTAGTTAA 


AGAAGAAAGT 


4860 


TATTTCTTTA 


ATATTAGTAA 


ATATACAGAC 


CGTTTATTAG 


AGTTCTATGA 


CCAAAATCCA 


4920 


GATTTTATAC 


AACCACCATC 


AAGAAAAAAT 


GAAATGATTA 


ACAACTTCAT 
• 


TAAACCAGGA 


4980 


CTTGCTGATT 


TAGCTGTTTC 


TCGTACATCA 


TTTAACTGGG 


GTGTCCATGT 


TCCGTCTAAT 


5040 


CCAAAACATG 


TTGTTTATGT 


TTGGATTGAT 


GCGTTAGTTA 


ACTATATTTC 


AGCATTAGGC 


5100' 


TATTTATCAG 


ATGATGAGTC 


ACTATTTAAC 


AAATA CTGGC 


CAGCAGATAT 


TCATTTAATG 


5160 


GCTAAGGAAA 


TTGTGCGATT 


CCACTCAATT 


ATTTGGCCTA 


TTTTATTGAT 


GGCATTAGAC 


5220 


TTACCGTTAC 


CTAAAAAAGT 


CTTTGCACAT 


GGTTGGATTT 


TGATGAAAGA 


TGGAAAAATG 


5280 


AGTAAATCTA 


AAGGTAATGT 


CGTAGACCCT 


AATATTTTAA 


TTGATCGCTA 


TGGTTTAGAT 


5340 


GCTACACGTT 


ATTATCTAAT 


GCGTGAATTA 


CCATTTGGTT 


CAGATGGCGT 


ATTTACACCT 


5400 


GAAGCATTTG 


TTGAGCGTAC 


AAATTTCGAT 


CTAGCAAATG 


ACTTAGGTAA 


CTTAGTAAAC 


5460 


CGTACGATTT 


CTATGGTTAA 


TAAGTACTTT 


GATGGCGAAT 


TACCAGCGTA 


TCAAGGTCCA 


5520 


CTTCATGAAT 


TAGATGAAGA 


AATGGAAGCT 


ATGGCTTTAG 


AAACAGTGAA 


AAGCTACACT 


5580 


GAAAGCATGG 


AAAGTTTGCA 


ATTTTCTGTG 


GCATTATCTA 


CGGTATGGAA 


GTTTATTAGT 


5640 


AGAACGAATA 


AGTATATTGA 


CGAAACAACG 


CCTTGGGTAT 


TAGCTAAGGA 


CGATAGCCAA 


5700 


AAAGATATGT 


TAGGCAATGT 


AATGGCTCAC 


TTAGTTGAAA 


ATATTCGTTA 


TGCAGCTGTA 


5760 


TTATTACGTC 


CATTCTTAAC 


ACATGCGCCG 


AAAGAGATTT 


TTGAACAATT 


GAACATTAAC 


5820 


AATCCTCAAT 


TTATGGAATT 


TAGTAGTTTA 


GAGCAATATG 


GTGTGCTTAA 


TGAGTCAATT 


5880 


ATGGTTACTG 


GGCAACCTAA 


ACCTATTTTC 


CCAAGATTGG 


ATAGCGAcGG 


AnAATTGCAT 


5940 
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AACCTCAAAT TGATATTAAA GACTTTGATA AAGTTGAAAT TAAGGCAGCA ACGATTATTG 6 060 

ATGCTGAACA TGTTAAGAAG TCAGATAAGC TTTTAAAAAT TCAAGTAGAC TTAGATTCTG 6120 

AACAAAGACA AATTGTATCA GGAATTGCCA AATTCTATAC ACCAGATGAT ATTATTGGTA 6180 

AAAAAGTAGC AGTTGTTACT AACCTGAAAC CAGCTAAATT AATGGGACAA AAATCTGAAG 624 0 

GTATGATATT ATCTGCTGAA AAAGATGGTG TATTAACCTT AGTAAGTTTA CCAAGTGCAA 6300 

TTCCAAATGG TGCAGTGATT AAATAACTGT ATTTTTAAAA ATTAGGAGAG ATAATTATGT 6360 

TAATCGATAC ACATGTC CAT TTAAATGATG AGCAATACGA TGATGATTTG AGTGAAGTGA 6420 

;5 TTACACGTGc TAGAGAAGCA GGTGTTGATC GTATGTTTGT AGTTGGTTTT AACAAATCGA 64 80 

CAATTGAACG CGCGATGAAA TTAATCGATG AGTATGATTT TTTATATGGC ATTATCGGTT 6540 

GGCATCCAGT TGACGCAATT GATTTTACAG AAGAACACTT GGAATGGATT GAATCTTTAG 6600 

20 CTCAGCATCC AAAAGTGATT GGTATTGGTG AAATGGGATT AGATTATCAC TGGGATAAAT 6660 

CTCCTGCAGA TGTTCAAAAG GAAGTTTTTA GAAAGCAAAT "TGCTTTAGCT AAGCGTTTGA 6720 

AGTTACCAAT TATCATTCAT AACCGTGAAG CAACTCAAGA CTGTATGpAT ATCTTATTGG 6780 

AGGAGCATGC TGAAGAGGTA GGCGGGATTA TGCATAGCTT TAGTGGTTCT CCAGAAATTG 6 840 

CAGATATTGT AACTAATAAG CTGAATTTTT ATATTTCATT AGGTGGACCT GTGACATTTA 6900 

AAAATGCTAA ACAGCCTAAA GAAGTTGCTA AGCATGTGTC AATGGAGCGT TTGCTAGTTG 6960 

AAACCGATGC ACCGTATCTT TCGCCACATC CGTATAGAGG GAAGCGAAAT GAACCGGCGA 7020 

GAGTAACTTT AGTAGCTGAA CAAATTGCTG AATTAAAAGG CTTATCTTAT GAAGAAGTGT 7080 

35 GCGAACAAAC AACTAAAAAT GCAGAGAAAT TGTTTAATTT AAATTCATAA AGTTAAAAGT 7140 

GAGAAAGATC AC CGCCATAA ATGTAAACGA TGCTATATTC GTTTAATATG CTATGGTTCT 7200 

TTCTCACTTT TTTAAATTAA AATATCGTGC ATGTGGAATA CGTGCGATAG AGATGGTTAG 7260 

AGCTTTGAAA TTAAC^TTG ^AGGW^CG TTTTAAA 7320 

GTAGAAGGAC GAGATGATAC TGAGCGTGTT AAACGAGCTG TTGAATGTGA TACGATTGAA 7380 

ACGAATGGTA GTGCCATCAA CGAACAAACT TTAGAAGTAA TTAGAAATGC TCAACAAAGT 7440 

CGAGGCGTTA TTGTATTAAC AGATCCAGAT TTCCCAGGAG ATAAAATTAG AAGTACAATT 7500 

ACTGAACATG TCAAAGGTGT TAAACATGCG TATATTGATA GAGAAAAAGC TAAAAATAAA 7560 

AAAGGGAAAA TTGGTGTTGA ACATGCCGAC TTAATTGATA TTAAAGAAGC GTTAATGCAT 7620 

GTTAGTTCAC CCTTTGATGA AGCTTATGAA TCAATTGATA AATCTGTGCT AATAGAGTTG 76 80 

GGGTTAATTG TTGGGAAAGA TGCAAGGCGC CGTAGAGAAA TTTTAAGTAG AAAATTGCGA 774 0 
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GCGGATGTAA GGCAAGCTTT AGAAGATGAA TGAGGAAGTG AAAATGTTGG ATAATAAAGA 7860 

TATTGCAACA CCATCAAGAA CGCGAGCGTT GTTAGATAAA TATGGCTTTA ATTTTAAAAA 7920 

AAGTTTAGGA CAGAACTTTT TGATAGATGT GAATATCATT AATAATATCA TTGATGCAAG 7980 

TGATATTGAT GCACAAACTG GGGTGATTGA AATTGGTCCA GGCATGGGGT CATTGACAGA 804 0 

ACAATTGGCC AGACATGCTA AAAGAGTATT GGCATTTGAA ATTGATCAAC GTTTAATACC 8100 

TGTATTAAAT GATACACTAT CACCTTATGA TAATGTGACG GTGATTAATG AAGATATTTT 816 0 

AAAAGCGAAT ATTAAAGAAG CTGTTGAAAA TCATTTACAA GATTGTGAAA AAATAATGGT 8220 

15 TGTTGCAAAC CTGCCGTACT ATATTACGAC GCCAATTTTA TTAAATTTGA TGCAACAAGA 8280 

TATACCAATT GATGGCTACG TGGTGATGAT GCAAAAAGAA GTGGGCGAAC GCTTAAATGC 8340 

TGAAGTAGGT TCAAAAGCAT ATGGTTCGTT ATCAATTGTC GTACAATACT ATACAGAGAC 8400 

TAG T AAAGT A TTAACGGTAC CTAAATCTGT ATTTATGCCA CCACCTAATG TTGATTCAAT 84 60 

AGTTGTAAAA CTGATGCAGA GAACTGAACC GTTAGTAACA GTAGATAACG AGGAAGCATT 8520 

CTTTAAGTTA GCAAAAGCAG CATTTGCACA AAGAAGAAAG ACAATTAACA ATAACTATCA 8580 

AAATTATTTT AAAGATGGTA AACAACACAA AGAAGTGATT TTACAATGGT TGGAACAAGC 8640 

AGGTATTGAT CCAAGACGTC GCGGTGAAAC GCTATCTATT CAAGATTTTG CTAAATTGTA 8700 

TGAAGAAAAG AAAAAATTCC CTCAATTAGA AAATTAAATG ATTGACAAAG CAAAGCACTA 8760 

TTGTTAAAAT TTAAATTTTG TTTGACGAAA ACGTTGCAAA TATGGTATTA TGTAACTTGT 8820 

AGCGAGGTGG AGCAATATGC CAAAATCAAT TTTGGACATC AAAAATTCTA TTGATTGTCA 8880 

35 TGTAGGAAAT CGTATTGTAC TGAAaGCCAA TGGAGGCCGT AAGAaAACAA TAAAACGTTC 894*0 

TGGAATTTTA AAAGAAACAT ATCCGTCAGT TTTCATTGTT GAGTTAGATC AAGACAAACA 9000 

CAACjTTGAG AGAGTATCTT ATACATACAC TGAT G T G TT A ACTGaAAATG TTCAAGTTTC 9060 

ATTTGAAGAG GATAATCATC ACGAATCAAT TGCACACTAA ATAAGACATA TAGAGATGTT 9120 

AGACGTTTCT TAGTATAAGA AGTAAATATT ATGATAATTA TTTGAGTGTT GGGcATTATG 9180 

TTCAAT ACTC TTTTTATTTA CAAAATGTTT AACACTGATG TTTCGCTTAT AGATTTTTCA 9240 

GTAAATGGAT AATTGTATTT ATAAACACAA ATACAAGTAA ATACTAAGTA ATTAGATGGA 9300 

GAAAATTACT TTTTTATTAA AAAAACACTA AAAAACAAAT TAAAATGTCA AATATTAATT 93 60 

CTC TTTATGT TAAAATCATC ATATTAAGAT AACGAAAAGA GGGCGGAAAA TGATATATGA 94 20 

AACGGCACCA GCCAAAATTA ATTTTACGCT CGATACACTT TTTAAAAGAA ATGATGGCTA 94 80 

TCATGAGATT GAAATGATAA TGACAACAGT TGATTTAAAT GATCGTTTAA CTTTTCATAA 954 0 
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AAATCTCGCA TATCGTGCAG 


CGCAACTATT TATTGAGCAA 


TATCAACTAA 


AG CAAGGTGT 


9660 


AACAATTTCT ATCGATAAAG 


AAATACCTGT TTCTGCTGGC 


TTAGCTGGAG 


GTTCGGCTGA 


9720 


TGCAGCAGCA ACGTTAAGAG 


GATTGAATCG ACTTTTTGAT 


ATAGGGGCGA 


GTTTGGAAGA 


9780 


ATTGGCTCTA CTAGGCAGTA 


AAATCGGGAC AGATATTCCG 


TTTTGTATTT 


ATAATAAAAC 


9840 


TGCACTATGT ACTGGAAGAG 


GAGAGAAAAT CGAGT1"1"1TA 


AATAAACCAC 


CTTCAGCTTG 


9900 


GGTGATTCTT GCTAAACCAA 


ACTTAGGCAT ATCATCACCA 


GATATATTTA 


AGTTGATTAA 


9960 


TTTAGATAAG CGTTACGACG 


TACATACGAA AATGTGTTAT 


GAGG CCTTAG 


AAAATCGAGA 


10020 


TTATCAACAA TTATGTCAAA 


GTTTGTCTAA TCGATTAGAG 


CCAATTTCTG 


TTTCAAAACA 


10080 


CCCACAAATC GATAAATTAA 


AAAATAATAT GTTGAAAAGT 


GGTGCAGATG 


GTGCGTTAAT 


10140 


GAGTGGAAGC GGACCTACTG 


TGTATGGGCT AGCACGAAAA 


GAAAGCCAAG 


CAAAAAATAT 


10200 


TTATAATGCA GTTAACGGTT 


GTTGTAATGA AGTGTACTTA 


GTTAGACTAT 


TAGGATAGAA 


10260 


GGGTTGAAAA GATGAGATAT 


AAACGAAGCG AGAGAATTGT 


TTTTATGACG 


CAATATTTGA 


1032.0 


TG 








10322 


(2) INFORMATION FOR SEQ ID NO: 99: 








(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5614 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 








(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 99: 






GATTGATTAA ATGTTTTAAT 


CCACTTCAAT GCCTTCGATA 


AACTCTACAA 


TCGCGCTATT 


60 


CATATAATTA TTCGATTTCA 


TTTGTTCAGC ATATGTCTCA 


TTAAATCCAG 


ACATAACTTT 


120 


TTTAAAwGCG AAAATTGAAA 


TTGGTATCGT TACTAATAAG 


GCACTAGCCA 


TACGCCAATC 


180 


AATGAGCATT ATGTATAAAA 


AGATAGCAGC TGACAAAAGT 


AAGTTTCCTA 


TAACTTCAGG 


240 


AATCATATGT GCTAAAGGTA 


ATTCTATTGT TTCAACCTTA 


TCGACAAATA 


TATTTTTTAA 


300 


TTCACCTATT TTCTTAGATT 


CCaCTACGCC TAAAGGGAGA 


CGCATTAATT 


TTTGAGCTAA 


360 


TTTTTTACGA ATTTCAGATA 


AAATTTCATA TGCCGTAATA 


TGTGATAGCA 


TCGTTGACGC 


420 


TCCAAAACAA CACACTTGTG 


AAATATAAGC GATTAAAGCA 


ATAAAGATAT 


AAACCATAAT 


480 


CGAATTAATC GTATATGTAT 


TGTTAATCAT CATTAAAATA 


ATTTTAAATA 


CTGCCCAATA 


540 


AGGAACTAAT CCAGAAAAGA 


CACTGATGAT AGACAACAAA 


ATTGATAACA 


TAATTTTCCA 


600 
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CCTkTCAATT 


AATAATCTAA 


ATTAAGCCGC 


TTATATTATT 


TATTTCACTG 


720 




ATAATATAAA 


TTTGTTATTT 


GTTAAAAATT 


AATACTTATT 


ACAAGTACAT 


780 


wAxnxnx i/vj 


TTGATAACGA TTATCAATGT 


CGCGTGGATT 


TGTGACACAT 


TTCTTTTAAA 


840 


£\A X X v_>\V*J-lr\vJ 


GTTATGGGGC 


AGAAATGATA 


AAGAGCCACT 


AATGATTTAT 


TATGTAGTGG 


900 


'1 "1 '/ ' M 1 'fif^/ 1 ^ A /' •* I • 


GGGACAGAAA 


TGATATTTTC 


ACAAAATTTA 


TTTCGTCGTC 


CCACCCCAAC 


960 


* I ~" I T\ ' 1 * f V 1 *T*f*^ 

I iOVJAl I\>iL 


TCTAGAAATT 


GGGAATCCAA 


TTTCTCTTTG 


TTGGGTCCCT 


GAATATAGCC 


1020 


1 lialAldcAKji v_ 


TAGTACATTG 


ATTTGTATCC 


CAATGTCCCT 


ATAATTGATT 


ATTCGCTTTA 


1080 


I V- lAAl ViATV- 


CTATGACTCA 


ACTATTAAAT 


CATTTTTCGA 


AATACTTAAT 


TCTAATATAA 


1140 


TT TV TV TV ii»T'^ TV 

1 TAAAi 1CAT 


TTATTGTAAT 


ATTGCAAAAA 


TACATTGCAC 


ACCTTGTTCA 


TCAATGCTAT 


1200 


TV TV 'T-I'TV TV M»*I*TA 

AATTAATTAC 


ATAATAAATT 


GAACATCTAA 


ATACACCAAA 


TCCCCTCACT 


ACTGCCATAG 


1260 




TATTTAGGTG 


TTGGTTATTT 


GTCACCITIT 


TTATTGTTGC 


GCGTTCGTAA 


1320 


CCAATUlGCA 


AAAAACGCAA 


CAAGACAGCC 


GCTTATAGCT 


GAAGTCATGA 


TGTTAATTAA 


1380 


*^TV TV TV >T»«T'/'* JV TV ^ 

TAAATTGAAC 


ATCCGTCATA 


CACCTCCTCT 


CTGCGTTAAA 


GTAACGCCCG 


AGATGTTAGG 


1440 


OG AC CAT CAT 


ATTATATCAT 


TTATTTATTA 


TATTTCACGC 


AATATTAAGG 


CTTAAGTAAA 


1500 




GTGGTTTACG 


CTACTTTAAT 


TGCTATCTTT 


TAAAATCCAT 


TTAGATAATA 


1560 


^ TV TV TV T*/^»T«/^ TV T* 

TAAATGTGAT 


GGGTATCGTA 


ATAATTAAAC 


CAGCAAATGG 


TGCAATTTCT 


GCTGGCAAAT 


1620 


TTAvjCCAGGA 


TACAAATACA 


TATAATAAAA 


CTGTTTGTAA 


GCTTACGTTG 


ACAATCTGCG 


1680 




ACTAATGAAT 


TTTCTCCAAG 


TAGG TTTT AC 


CCTGTAAACA 


AAATAACAAT 


1740 


JA7A7ATTV TV T* TV 


TGAAATCACA 


AAAGCGACTA 


GAAATCCGGT 


AATATGACTA 


ATCATATATT 


1800 


r^TA TV TV **TV »*VTV TV 


TAATTTTAAC 


AGCAATAAAT 


AGACAACATA 


ATAATTTAAC 


GTATTAATGC 


1860 


/VP/^* TV O TV TV T» 


GATAAATTTT 


AAAATTTCAG 


CATGCGTTTG 


TGTTAGTTTC 


ATATGTGTAc 


1920 


lv»C 1 LAnLAi 


CAAAATATAT 


GCATAACTAC 


GTTCTCGAAC 


ATACTCGAAT 


ATGCGAGCCA 


1980 




CTTCAAATAT 


GCTTATTTCA 


ATCTTTATAC 


CCTTTCACAG 


CAAATTTAGT 


2040 


CTCTTTCCCC 


TCATCCTTAT 


ACGCCATTAT 


AATGTAACTG 


ATTTATCGCG 


TGACTCATTA 


2100 


wv*ALtATnuA 


GATTACTTTA 


GTTCACTAGT 


AATTTTATAT 


ACAATAAGAG 


CGACAACAGT 


2160 


AATGAGAGGA 


TGTCTACTAT 


GCAATTACAA 


AAAATTGTCA 


TCGCTCCTGA 


CTCATTTAAG 


2220 


GAAAGTATGA 


CCGCACAGCA 


AGTTGGCAAT 


ATTATAAAAC 


AGGCTTTTAC 


TAATGTTTAT 


2280 


GGGAATACCC 


TTCATTATGA 


TATCATTCCG 


ATGG CTG ATG 


GTGGTGAAGG 


TACCACAGAT 


2340 


GCTTTAATGC 


ATGCAACAGG 


TGCCACTAAG 


TATACAGTCA 


TCGTTAATGA 


CCCTTTAATG 


2400 
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GCGGCAGCGT 


CAGGTTTGGA 


TTTATTAGAA 


AAAGAGGAAC 


GTAATCCTTT 


ATACACATCA 


2520 




TCATATGGTA 


CCGGTGAACT 


AATTAAAGAT 


GCATTAAATC 


ATGGTGCTAA 


GAC CATT ATT 


2580 


5 


TTAGGGATTG 


GTGGCAGTGC 


AACAAATGAT 


GGTGGTACAG 


GTATGCTAAG 


TGCACTAGGC 


2640 




GTAAAGTTTA 


CTGATGTAAA 


CGGGGACTTA 


TTACAAATGA 


ATGGTGCTAA 


TCTTGCTCAC 


2700 




ATTGCACAAA 


TCGATATAAC 


CAATCTAGAT 


TCGCGATTAA 


AAGAGGTGAC 


CTTTAAAGTG 


2760 


10 


GCCTGTGATG 


TTTCAAATCC 


TTTATTGGGT 


GAAAATGGTG 


CTACCTATAT 


TTATGGTCCT 


2820 




CAAAAAGGCG 


CTGATGCAAA 


GATGATACCA 


AAGTTGGATT 


TCGCAATGTC 


G CATT AT CAT 


2380 


15 


GATAAGATAA 


AAATGTG CAC 


AGGAAAGTCC 


GTTAATCAAA 


TAC CAGGTTC 


TGGTGCAGCT 


2940 


GGCGGTATGG 


GCGCAG CATT 


ATTAGCGTTT 


TGTGAGACAA 


CTTTAACAAA 


AGGTATTGAT 


3000 




GTCGTCTTTG 


ACATTACAGA 


TTTTCATCAA 


AGAATTAAAG 


ATG CAGACCT 


CGTTATTACT 


3060 


20 


GGAGAAGGAC 


GCATGGATTA 


TCAGACCATC 


TTTGGTAAAA 


CACCCGTAGG 


CGTTGCGTTA 


3120 




GCTGCAAAAC 


AATATCATAT 


TCCTGTCATC 


GCGATTTGTG 


GCAGTCTAGG 


CGAAAATTAT 


3180 




CAACATGV1T 


ACGATTTCGG 


TATTGATAGT 


GCCTATTCTA 


TAATCTCTTC 


ACCTAGCACT 


3240 


25 


TTAGAAGATG 


TCCTACAAAA 


TAGCGAACAA 


AATTTATTAA 


ACACTGCAAC 


TGACATTGCT 


3300 




CGTATTCTGA 


AATTACAATA 


ATGTCAAAGT 


AAATCATCAG 


CTTTATTATT 


TGCAGTTAAA 


3360 




ACTTGAATGA 


GGTGAAAGCC 


ATGAAAAGAA 


CTGATAAATA 


CCGTGATTCA 


TATCAATACG 


3420 


30 


ACAATCAAAA 


CCAAAATCAT 


CGTCGTCAAT 


CTGAAGACGC 


ATCGTATAGA 


CAACAATATG 


3480 




CTAAAGGCGA 


TCCTGAAGAA 


CACCCGGAAC 


GATACTATAA 


TGGTAGAGAT 


TATCGAAGAG 


3540 


35 


AACAAATTCT 


TGAAGAAGAA 


AACGAGAAAT 


CCCGCCGTTC 


AAAAAAATGG 


TTATATATCA 


3600 


TT ATTG C CAT 


TCTCTTAATT 


ATTGTCGCTA 


TTTTTGTCAC 


ACGCG CCTTA 


CTTAACAATG 


3660 




ATAGCGATAA AGTTAGTAAT 


GACCCTAAAG 


TCTCTCAAAA 


TTATAAAAAA 


CAAGTTGAAA . 


3720 


40 


-ATCAAGACGG 


CCAAATTAAC 


-CAGCAAGTAG 


- ATAATGCTAA 


AGAAAATATT 


AAAAACAACC 


3J7.8.0_ 




AAAAAACTGA 


TGACATTATT 


AAAAATTTAC 


AAAATCAAAT 


CGACAACTTG 


AAGCAGCAAG 


3840 




AACAAAACAA 


AGCTGATTCT 


AAGCTAACTC 


AATTTTATCA 


AGACCAAATC 


AACAAATTGA 


3900 


45 


CAGAGGCAAA 


TAATGCACTT 


AAAAACAATG 


CAAGCCAAGG 


TAAAATTGAA 


AGCATGTTAA 


3960 




ATGATATTAA 


TACAAAATTC 


GACAGTATTA 


AATCTAAATT 


AGAAAGCTTA 


TTTAAAGATG 


4020 




ACAATGGTGG 


CGCTAATTAA 


TT ATT ACAC C 


TGCTTTGATG 


ATAAACATTA 


ATTCCCTATA 


4080 


50 


CTTTAT CTGT 


ATCACTACGT 


TATTCGTGAT 


GATGCATTAA 


GAGTATAGGG 


ATTTTTTATA 


4140 




TAAACTTGTA 


TTCTAACTAC 


ATACAAATAC 


ACAGAAAACG 


TATATAATTT 


ATATAATTAT 


4200 
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TTATTGCTAA 


TTACGTTAGG 


CGTCATGACC 


GCTxTTGGCC 


CACTAACTAT 




A "5 A 

4320 


GTACCATCAT 


TACCTAAAGT 


GCAAGGTGAT 


TTTGGTTCTA 


CTACATCAGA 


AATTCAATTA 




ACATTATCAT 


TCACAATGAT 


TGGTCTTGCA 


CTAGGCCAAT 


TTATCTTTGG 


ACCTTTATCC 


A d 4 ft 
*i ^ U 


GATGCTTTTG 


GTCGCAAACG 


GATTGCTGTA 


TCCATTTTGA 


TCATTTTCAT 


TTTGGTATCA 




GGTTTGTCTA 


TGTTTGTTGA 


TCAATTGCCA 


TTATTCTTAA 


CTTTACGATT 


TATTCAAGGT 


J. ^ £ft 
*■ O O U 


TTAACTGGTG 


GTGGCGTCAT 


CGTGATTGCA 


AAAGCCTCTG 


CTGGTGATAA 


ATTTAGTGGC 


Agon 

*« D « U 


AACGCACTCG 


CTAAATTTTT 


AG CAT CTTT A 


ATGGTAGTTA 


ATGGCATCAT 


CACTATTCTT 


** o o U 


GCACCATTAG 


CCGGTGGATT 


AGCTTTATCC 


GTAGCAACAT 


GG CGTTCTAT 


TTTCACAATT 


A Til ft 


TTAACTATTG 


TGGCACTCAT 


CATTTTAATT 


GGCGTCGCTT 


CTCAATTACC 


TAAAACATCT 


*±o\J\j 


AAAGATGAAT 


TAAAGCAGGT 


GAATTTTAGT 


AGCGTCATTA 


AAGATTTTGG 


• ■••vj x w x x x x w 




AAAAAACCAG 


CATTTATTAT 


TCCAATGCTA 


TTACAAGGwT 


TAACTTATGT 


AATGCTATTT 


** J ^ u 


AGTTATTCAT 


CTGCATCGCC 


ATTTATTACT 


CAAAAATTGT 


ATAATATGAC 




A Q A ft 


TTTAGTATCA 


TGTTTGCTGT 


TAACGGTGTA 


GGTTTAATCA ' 


TTGTCAGTCA 


AGTCGTTGCT 

«*w X ^ w X X VJV_ X 


end ft 


TTATTAGTAG 


AAAAATTACA 


TCGCCACATA 


TTATTAATCA 


TTTTAACTAT 


TATACAAGTtt 




GTAGGTGTTG 


CTTTAATTAT 


CCTGACACTT 


ACATTCCATT 


TACCACTTTG 




5 1 6 ft 


ATCGCATTCT 


TCTTAAATGT 


GTGT CCTGTG 


ACGTCAATTG 


GACCGCTTGG 


TTTCACAATG 


*> ft 
17 ^ ^ U 


GCTATGGAAG 


AACGAACAGG 


TGGCAGTGGT 


AACGCATCAA 


GTTTACTTGG 


CTTATTCCAA 


J D V 


TTTATCTTAG 


GTGGCGCTGT 


TGCACCATTA 


GTTGGCTTAA 


AAGGCGAATT 


TAATACATCA 


534 0 


CCATATATGA 


TTATTATCTT 


CATTACAGCC 


ATTCTATTAG 


TCAGTCTACA 


AATCATTTAC 


54 00 


TTTAAAATGA 


TTAAAAAGCA 


ACATGTCGCA 


TAACACTTCA 


ACATAATTAG 


AACCCTAGCA 




AAGATATCTA 


TCTTTGTCAG 


GGTTCTTCTT 


TATGAATTAT 


GAGATCGAAT 


CTTCAACTAA 


5520 


AATTACGCCT 


TCATAGCAAG 


GACATTTCTA 


TTCAATCACC 


CTTTAACAGG 


CATCCAAATT 


5590 


T CTGTAAT AT 


Arrrri'CACT 


TGTAGTATCA 


CCAT 






5614 


(2) INFORMATION FOR SEQ ID NO: 100: 









45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9179 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDN ESS : double 

(D) TOPOLOGY: linear 

50 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 100: 
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AAAGACAATG ATATGAAGTA TATGGATATC ACAGAaAAAG TGCCAATGTC GGAATCTGAA 12 0 

GTTAACCAAT TGCTAAAAGG TAAGGGGATT TTAGAAAATC GAGGGAAAGT TTTTCTAGAA 180 

GCTCAAGAAA AATATGAGGT TAATGTCATT TATCTTGTTA GCCATGCATT AGTAGAAACA 240 

GGTAACGGCA AATCAGAATT AGCAAAAGGC ATTAAAGATG GGAAAAAACG CTATTACAAC 300 

TTTTTTGGTA TAGGAGCATT CGATAGTAGT GCTGTTCGTA GTGGGAAAAG TTATGCTGAA 3 60 

AAGGAACAAT GGACATCACC AGATAAGGCG ATTATTGGTG GTGCAAAGTT CATTCGTAAT 42 0 

GAATATTTTG AAAACAATCA ACTGAATTTA TATCAAATGC GATGGAATCC AGAAAATCCT 4 80 

GCGCAACATC AATATGCGAG TGACATTCGC TGGGCAGATA AAATTGCCAA ATTAATGGAT 54 0 

AAATCCTATA AGCAGTTTGG TATAAAGAAA GATGATATTA GACAAACATA TTATAAATAA 600 

GACATCGGTG CTTAAAGGAG CTGGAACAAT TTATTGTTTC GAGCTCCTTT AGCGCATTCT 660 

20 GAGTGTGTTA GTTAAATGGA TTTTAACCTA ACAAAAAACG CT AT AT AG CA TCAAATATGC 720 

TATATCCCAC ATCATTGTTA CAAATGTACA TGATGTAAAT GAATATTGCT GTCTAAATGT 780 

GCATGTAATA TACAATGGTG CAGATAATAC ACTTAAGTCC TTAAAAATGA AACGTTAgTT 84 0 

25 CCAAGAGTCA TTTTTAAACA ATAGTGCATG TGATAAAATA GAAAAGAATG AAAAATATAG 900 

AGGTGACAAT ATGAAGATAG CAATTATAGG TGCAGGCATC GGTGGATTAA CAGCTGCTGC 960 

ATTATTACAA GAACAAGGTC ATACTATTAA AGTCTTTGAA AAAAATGAGT CAGTTAAAGA 1020 

AATTGGCGCT GGGATTGGTA TCGGAGATAA TGTGCTTAAA AAACTAGGTA AT CATGACTT 1080 

AG CTAAAGGT ATTAAAAATG CTGGGCAAAT CTTATCTACA ATGACAGTGT TAGATGACAA 114 0 

AGATCGCCTG TTAACTACTG TTAAATTAAA AAGTAATACA TTGAATGTGA CGTTACCACG 1200 

CCAAACATTA ATTGACATTA TTAAATCTTA TGTAAAAGAT GACGCAATAT TTACAAATCA 1260 

TGAAGTCACG CATATAGATA ATGAGACAGA TAAAGTTACC ATACATTTCG CGGAACAAGA 1320 

AAGTGAAGGA TTTGATTTAT GTATTGGTGC TGATGGAATT CATTCTAAAG TGAGACAATC 1380 

40 



30 



35 



TGTAAATGCT GACAGTAAAG TATTATATCA AGGGTATACA TGCTTTAGAG GTTTAATTGA 1440 

TGATATTGAT TTAAAGCATC CGGaTTGTGC AAAAGAATAC TGGGGaAGAA AAGGaAGAGT 1500 

45 AGGTATTGTT CCGTTATTAA ATAATCAAGC ATATTGGTTC ATTACAATTA ACTCGAAGGA 1560 

AAACAATCAT AAATATAGTT CGTTTGGTAA ACCTCATTTG CAAGCATACT TTAATCACTA 1620 

TCCAAATGAA GTTAGAGAGA TCTTAGACAA ACAAAGTGAA ACAGGTATCT TATTGCATAA 168 0 

50 

TATTTATGAT TTGAAACCAC TCAAATCTTT TGTTTATGGT CGTACTATTT TACTAGGAGA 174 0 

TGCAGCACAT GCGACAACGC CTAATATGGG GCAAGGTGCT GGACAAGCAA TGGAAGATGC 1800 
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TAAAATACGT GTCAAACATA CTGCAAAAGT AATTAAGCGT TCTAGAAAAA TCGGTAAAAT 1920 

TGCCCAATAT CGTAGTCGTT TATTTGTTGC AGTTAGAAAT CGTATTATGA AAATGATGCC 1980 

AAATGCATTA GCAGCTGGAC AAACTAAATT CTTATATAAA TCGAAAGAAA AATAATACAA 204 0 

CAATATGAAA ACCCCCGTAT GTTGAAACGA GAGCTCAACA TATGGGGGTT CTTGTTTTTA 2100 

TAATGTTATT ATAATAAATT CAATTATTAG TTAACGACAA ATTGTGGTTT CTCACCTTGA 216 0 

ACGGCACTAA TTG CAGCATT AGCAACAATT TTAGACATCA TGTCACGTGC TTCAAATGTA 222 0 

GCATTACCAA TATGCGGTGT TAATACTACA TTATTAAGTG ATTTTAAGTC ATCGGTAATA 228 0 

y5 TCTGGTTCAA ATTCATATAC ATCAAGTGCA GCACCTTCAA TTTCATTATC TTTCAATGCT 234 0 

TGCACTAGTG CTTGTTCGTG CACGATTGGA CCACGAGAGG CATTGATTAA ATACGCCGTA 2400 

GATTTCATCA TTTTAAATTG TTCTGTATCA ATTAAATGAT GCATTTTAGG ATTATAAGCA 24 60 

20 GCGTTGATAG TGATAAAATC TGCATTCTTT AATAGTGTAT CTAAATCTAC ATATTTTGCA 2520 

CCGATTTCTC GTTCTTTTTC TTCTTTGGGA TTAGGTCCAG TGTATAGCAC ATCCATGTCA 2580 

AATGCTCTTG CACGACGAGC TACTGCACTA CCAATTTCAC CTAAACCGAT AATGCCGATT 264 0 

GTTTTCCCAG ATACTTCTCT ACCTCTGAAA AATAAAGGTG CCCATCCATC AAATCCAGTT 270 0* 

GTACGTGATA ATTGGTCCCC TTCAACAATA CGACGCGCTA CTG CAAGT AC TAATCCAATT 2760 

GTTAAATCAG CAGTCGCGTT TGTTGATGCT TTAGGTGTGT TTGTAACATC TATACTTTTT 2820 

TCTCGGGCAT ACTCGATATC AATATTATTA AAACCAGCGC CAT AGTTGG C AATGATTTTT 2 880 

AAGTCTTTAC CAGCATCGAT AACATCTTTA TCAACGTTTG TAGATAATAA ACTAATTAAG 2940. 

GCAGTCGCGT TTTTAACACC TTTAATTAAA GTGTCTTTAT CGACTAATCC TTTACCTTCA 3000 

TACATTTCAA CTTCAAAATG TTCTTGTAAA AGTTTTAAAC CTACTTCTGG TATtGCACCA 3060^ 

gCAACATAAm CTTTTtCCAT AAAAGAtCAC TCCTTTTATC TTAGTATAGT AGAAGATTAG 312 0 

40 ACAGTATACA ACT ATGT CAT GATGTCTTGT GTATCAATGA TGTAAGCGCG TACTTTTGAT 3180 

GGAGGCGATA TAACTTAGGC ACTGTAGAAC TATGAATATT GTAATGTGGA AAAACTGGAT 324 0 

CAATTAAATT AGATAACGTA GTTTTAAAGT TAATAGTATT AGAAAAAATT AATATTTTGA 3300 

ATATGGGAGG AAATATAAAT AAGTAGGTGG CAACGAAAAA TAGCAAAAAA AGAGCTTCTC 3360 

CTATAAAGGA AAGCTCAAAG TTTTTTGATG ACATATGTAC TAGAATTAAG TTTCAAGACA 34 20 

ATATGTATCA TCGTGTTTAT ATTAAATATG GATGTAGTTG TAGTTACCTG CTTCACTTGC 3480 

AGAAATAGTT CTAGAACTTA CTGAGAAAGG TCCGCCACTA TAATTCATTT CTGAAATTGT 354 0 

AACTGAACCA TCACTGTTTA CACTTTCTAC ATATGCAACG TGACCAAATG GTCCTTCAGA 3600 
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AGCAGCAGCC CAATTATTAG CATTTCCCCA AGTAGAACCG ATTTCTCCGC CAACTTTATC 3720 

ATATACATAC CAAGTACATT GTCCTGCAGT GTATAAGTTA CCAGAATGTG AAATTGATGA 3780 

TGTAGTTGTC GTAGTTGTCG TAGTCGTTGT AGTTTGAGTC GTGTTGTAGT TATAGTTGTT 384 0 

GTAATTTGTA TAATTTTCAG CAGCATCTGC ATGATGTGCT TGACCTACTA ATGCTGTGCC 3900 

GATTCCTGCT GTTAACGTAG TTG CTGTT AC TAATTTTTTC ATGAATAAAG TCCTCCAAAG 3960 

TTCTATATCT TTTTTTATAA ATAAAACGTA GCGACTGTTT TATTCTCACA TCTCGAATTG 4 02 0 

ATGACAATAG TTACTTTAAC AAAATtAATG cTTCTTGTGG GGAATGTTAT TGATTTGTAA 4 080 

AAGAATAAAA AAACTTTGAC TAATTTTGTA ATAAAAATTA GTCAAAGTTA CAATGAGATT 414 0 

AACAGATAAT TAATAGGAAA TATTTATTTG TAATATGTTT AAATAAATCG AATTGTTAAA 4200 

GGTATTATAT ATTCTTGGCC ATTATAATAT TTGACACACG CAATAATTGT GAATACAAAA 4260 

20 GATAATATTG AGAAAGCGAA TATGGATAAA ATACCGATAA ACGTAATGAT GAAACCTATA 4 320 

ATAATAATGA AATCAATATC TGTAGCAATT AGGAAAACGC CTATTAAAGT GATAACGACT 43 80 

AAAACGATAG ACCAAATAAT ATAAGAAATC GTATAGTTAA GATAATTTTT TCCAGCACGA 444 0 

25 TCAACTAGTT TCGATTCATC TTTTTTCAAT AACCATATTA TCAGTGGACC AATAATAGAT 4500 

GTGAATAAAC TTAATAAATA GATAAGCATC GCCATAATGT TCTCATCATT GGATTTGCGA 4 560 

TTCGGTTGAT GATTTGTTAC GTCGTTCATT TCAGTTGTCA TATTAGACAC TCCTTTGAAA 4 620 

ATTGTAATAT TATCTTTAAC TATAACAAAA TATAATCAAA AATAAACATG TTTATTAAAC 4 680 

AATTATTAAA AATAAAAATA ATTGGTGGAC GTCGGCGTTT AAATAGGTTA ATTTAAGGTT 474 0 

ATATATACTT AACATTTATA ATGATGCGTA ATGAATTCGC ATCATTTTTA TATTGTCTTA 4 800 

CGTATAATTT GTTTTTAATT TTAACCAAAG ATAGAAAGAG GGTTGTTTAT GAAAATAGCA 4 860 

ATTGTAGGAT CAGGAAATGG CGCAGTTACG GCAGCAGTAG ATATGGTGAG CAAAGGCCAC 4 920 
40 GATGTTAAAT TATATTGTCG TAATCAATCT ATAAGTAAGT TTCAAAACGC AATCGAAAAG 

GGCGGATTTG ATTTTAATAA TGAAGGTGAT GAACGTTTCG TAAAATTCAC TGATATTAGT 504 0 

GATGATATGG AATATGTTTT AAAAGATGCT GAAATTGTTC AAGTGATTAT TCCATCTTCA 5100 

45 TACATAGAGT ATTATGCTGA TGTAATGGCA GAGCATGTAA CTGATAATCA GTTGATATTC 5160 

TTCAACATGG CTGCAGCAAT GGGGTCAATT CGTTTTATGA ATGTTTTAGA AGATAGACAT 5220 

ATTGAAACAA AACCACAACT AGCGGAAgcT AATACGTTGA CGTATGGTAC G CGTGTCG AT 5280 

SO 

TTTGAAAATG CAGCAGTTGA TTTATCTCTA AATGTACGTC GTATCTTCTT TTCAACATAT 534 0 

GATAGAAGCT GTCTAAATGA TTGTTATGAC AAAGTTTCAA GTATTTATGA TCATTTAGTA 54 00 
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CCAACATTAT TGAATGTCGG TCGCATTGAT TATGCTGGCG AGTTCGCTTT ATATAAAGAA ~ 552c 

GGAATTACTA AACATACAGT T AGATT A CTT CATGCAATCG AATTAGAACG TTTGAATTTA 558c 

5 GGCCGTAGAT TAGGTTTTGA ATTATCAACA GCTAAAGAAT CACGTATTGA ACGTG GTT AT 564C 

TTAGAACGTG ATAAAGAAGA TGAACCATTA AATCGTTTGT TTAATACAAG CCCAGTATTT 570C 

TCACAAATTC CAGGACCAAA TCATGTAGAA AGCAGATATT TAACTGAAGA TATTGCATAT S760 

w 

GGTTTAGTAC TATGGTCAAG CTTAGGTCGT GTTATTGATG TACCGACACC AAATATAGAT 582 0 

GCAGTAATTG TAATTGCATC AACCATTTTA GAGAGAGACT TCTTTGAGGA AGG CTT AA CA 5880 

, 5 GTTGAAGAAA TTGGTTTAGA TAAGCTTGAT TTAGAAAAAT ATTTAAAATA AATGATGGCT 5940 

TGAAGATAGA AAAGGATATA GCATTATGCA AAAGCAATAA ATTGAAGAAA AGAGGTTTCT 6000 

CATCAATAAG CGnAGGGGAC GATAGATGAT GAAAAGAAAA CCCACCTTTT TAGAATCAAT 6060 

20 TTCGACAATG ATTGTAATGG TTATTGTTGT TGTAACAGGC TTTGTGTTTT TTGATATTCC 6120 

AATTCAAGTA TTATTAATTA TTGCCTCAGC ATATGCCACA TGGATTGCAA AACGTGTAGG 6180 

CTTAACATGG CAAGATTTAG AAAAAGGCAT TGCAGAACGT TTAAATACTG CAATGCCTGC 6240 

AATTTTAATT ATACTAGCGG TAGGAATTAT AGTAGGCAGT TGGATGTTTT CTGGCACAGT 6300 

GCCAGCCTTG ATTTATTATG GCTTAGATTT ATTGAATCCA AGCTATTTTT TAATATCAGC 6360 

CTTTTTTATA AGTGCTGTTA CATCTGTAGC AACTGGTACA GCATGGGGCT CTGCATCAAC 6420 

TGCAGGGATT GCACTTATTT CTATTGGTAA TCAATTGGGG ATTCCTCCAG GGATGGCAGC 6480 

GGGTGCTATT AT AG CAGGGG CTGTGTTTGG CGATAAAATG TCACCATTAT CAGATACAAC 6540 

TAATTTAGCG GCGCTTGTTA CTAAAGTTAA TATATTTAAA CATATACATT CGATGATGTG 6600 

GACGACGATA CCTGCATCAA TCATAGGTTT ATTAGTATGG TTTATTGCTG GATTTCAATT 6660 

TAAAGGGCAT TCAAATGATA AACAGATTCA AACTTTGTTA TCAGAGCTTG CACAGATTTA 6720 

40 TCAAATTAAC ATATGGGTCT GGGTTCCCTT AATTGTGATC ATTGTTTGTT TGCTATTTAA 6780 

AATGGCTACA GTGCCAGCTA TGCTAATATC AAGCTTTTCT GCCATTATAG TGGGGACTTT 6840 

TAATCATCAT TTCAAAATGA CAGATGGTTT CAAAGCAACA TTTAGTGGTT TTAACGAATC 6900 

4S AATGATACAT CAGTCTCATA TTTCATCCAG TGTGAAAAGC TTGTTAGAAC AGGGTGGTAT 6960 

GATGAGTATG ACCCAAATAT TAGTAACGAT ATTTTGCGGA TATGCATTTG CAGGTATTGT 7020 

AGAAAAAGCA GGATGTTTAG AAGTCTTATT AACTACTATT TCTAAAGGCA TCCATTCTGT 7080 

SO 

AGGAAGTTTA ATATGTATTA CTGTTATTTG TTGTATTGCG CTTGTATTCG CTGCAGGTGT 7140 

TGCTTCGATT GTAATTATTA TGGTCGGTGT GTTAATGAAA GATTTGTTOG AAAAATACCA 7200 
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AATACCATGG GGAACATCAG GTATTTACTA TACGAATCAA CTTCATGTCT CTGTTGAAGA 1320 

ATTTTTCATA TGGACAGTAC CATGTTATTT ATGCGCAATT ATAGCAATTA TCTATGGTTT 73 8 Q 

TACAGGGATA GGTATTAAAA AGTCATCGAA TTCACGTTTA ACTTAATGTG AGCGTGGAAT 7440 

ATATATAATA TGTTGAAACA CTTTAATCAT TTATAATTGT AGCGGTTATA ATTTGAAAAG 7500 

GTTTTAACTT AGAATAAATA TCCTCTATGC ATATACTGAA TATGTTTTGT AGCGGAACAT 7560 

GTTGATATAT GTAATGTAAG TTTTATGTCA TGATTTGTAA TGACTAAATT AATTGAGAAT 7620 

TTGAAGGCAA GTATATTTGT AAGTACTTTA ACTAAAAATT TATCAATGTA TAGCCGATTT 7680 

GACATGCCTA AATTTGGGTG TGTCAATGGC TGTATGTTGT TTATTCTTTA TTACAGAGTG 774 0 

AATCGGATTG GTGAAAATCG AAATTTTGAG A TTTTTACCA ATTCGATTTT TTTCATAGAA 7800 

ATTAAAAAAG CCAACAAGGC TCTTGAAACC TTGTTGGCGT AAA CAT AG CC ATCACTAATT 7860 

2Q AGTGAATGAA GTTATAACCA GCAGCTTGGC TAG CTGAGAT TGTACGTGAA GTTACAACAC 7 920 

CTGGGCCATA ACCATAGTTC ATTTCTGAAA CTCTTACTGA ACCATTGCTG TTAACACTTT 7980 

CAACGTATGC AACGTGACCG TATGCACCTT GAGTTGTTTG CATAATTGCA CCAGCTTTTG 804 0 

25 GTGTATTGTT CACTGTGTAA CCAGCTCTTG CAGCTGCGTT AG CCCAGTTA CTTGCATTGC 8100 

CCCAAGTTGA ACCGATTTTA CCACCTACAC GATCAAATAC GTAGTATGTA CATTGACCAG 8160 

AAGTGTATAA GTTACGTCCT GAAGTATAAC CACTTGAGAT TGAACGGCCA TTTGATGATG 8220 

GAGCCATAGT TGTAGTTACT TGAACATTGT TGCTTGAAGT GCTGTAGCTT GCACCTAAAC 82 80 

CACCAGTACG GTAGCTGTTT GTGTTGTAAC TATTATAGTT ATTGTAGTTA TATGATTGAT 834 0 

TATTATTTGA GTAGTTGTTG TAACGG CTGT AGTTATTGTA GCTATAACCG TTGTTGTAAT 84 00 

TGTTATAGTT ATTGTAACCA TTGTAGTAGT AATAGCTGTA GTAGCCATTA TCTTGGTTTA 84 60 

ATTGACTTGG ATGCCAGTTA CCTTTCCATG TGTAATGGTA GTTACCTTGT GCATCAATAG 8520 

40 TGTAAGTATA GCTATATGAT GTTGGGTCG T TT GGATTATA ACCGTAGTTA TCTTGCTCAG 8580 

AAG CATGAGC TTGATTTCCT GATGCAATTG CGATTGTAGC GAATCCTGCA GTTGCGATAG 8640 

TAG CTGTAGC GATTTTCTTC ATTTTAAAAA TATCCTCCTA AAAATTTTAA ATCTAAAATA 8700 

45 TTTTCGTAAT GTCCGTGTGA CAAAATTAAT GTTATAAGTT ATCTCTCGTA ATTAAACGAC 8760 

AAGAAAGACT ATAACAGAAA TTAGCGTCCT TGTGTGCTTT GTTAACGTTT TGTAATTTTT 8320 

TGCTAATATC TTGACACAAT AGAATTTTAA AAGTATAGAA ATTTGCATTT TGCAAAACTT 8 8 80 

ATAACTACGG CATTCTTTGT GAAAACTGAA TGTTTCGAAA ATAAGTCTGT TACAAATTTG 8 94 0 

TAATATTACT GAAAATTCTA AATGTATATT TTGTGCATAA TATAGGACTT TTAATCAGAA 9000 
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GGATGAAAAT GTATATTTAA TGGATAAAAT ATCCTAATTT AGCATAAAAA AATGTTTTAA 
TAAAAGTATT ATTTGATATA ATCGATTTAT GTTTTGTTAC TGCTAAAAAA CATGTGGCG 
(2) INFORMATION FOR SEQ ID NO: 101: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1868 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: ! 
CCTTCAGCCA TTTGACTTCG ACATGAGTTG 
GTCATAACAA TCTCCTAATT AATTAAAATA 
TTATAAATAG TACTGGAATT GTAATGATGA 
TCTTAACATC TTTTTGtGTT AAGACGTGTA 
GTGTAATTTT TGG AC CT AAA TCAGAAC CGA 
ACATGCCATG GACATTTGAT TGACCAATAG 
TATTCATTAT TGATGATAAA AACGCTGAAA 
GACCGTAATT GGAAATATAT TCTAATATTT 
TTAAG CCGAA TACGACGATA TACATACCAA 
C CTTAATG AC TTGCTTAATA TTTACAGCAT 
AAGCAATGAT TCCAGTGAAA ATTGATACCG 
CGAAAAGTAA TATAACTAGA ACAATCCaTG 
CATCFTTAGG ATGCTTTATA TTATTATCAT 
ATAACCACAA TACTATAATA CTTGCTAAAA 
TAAAATATCG AACGAATCCT ACATGAAAAT 
TCACGATTAA AGGTAAAGAA GTTGTGTCAG 
ATATGGCCCG CTTACTAAAA CCTATATTTT 
TTAAcGTGCG CCATCATTTG CGAAAAATGC 
AACGAACATT TTTAAACCAT TGCCTTTTGA 
GAATAAT CCA ACTTT A TCTA ATATTAATGA 
AGCATTCCAA ACAATACCTG TTACTTCGAA 



iEQ ID NO: 101: 

CCTGTACATA TAAAATAAAT TGTTTTTTTA 
TGATAAGTGT TAGATACAAC CCTATGAGGG 
TACCAGTTTT AAAGTATGTG CCCCAAGAAA 
AC CACAGTAA TGTAGCTAAA GAGCCTATCG 
TAACATTCGC ATAAATTAGG CCTTCTTTTA 
CAATCGCATC TATTAAAACT GT AGG CAT AT 
TGAAGCCCAT TCCCAAAATA GTGCTAAATA 
TAGCCAATAT TAAAGTAATG CCAGCATTTC 
TTGAAAATAA TACTATATTC CAAGGTGCGC 
TTGATTTACG AGCCAACATT AGAAAAATAA 
GAATTTTAGT AAATTTACTG ATTAGATAGC 
AAATTTTAAA TAGCTTTAAA TCATTAATGG 
CAAACGTTTT AGGTATCGCT TTTCTAAAAT 
GCGAGAATAA ATTAGGTATA ATCATTCTAC 
AATCAGCAGA TATAATATTC ACTAGATTGC 
CTATAAAACC ACTCGCAATA ATnAAAGGGA 
TAACCATCGC TAATACAATA GGCGTTAAGA 
AGCAACAATG GCACCCAATA ATATGATATA 
AGCATGAAGC ATGTGAATAG CTGACCATTC 
AATAAGAATG ACTGAGACAA AAGTCAAAGT 
AACATCGGAA AAACTTACAA CACCAGTAAT 
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TAATACAAAT AATAAAGTTA CTAGAAAAAT GAGTGTCGCT AAAGTTGTCA TCATTAGCAT 
TCACCAGTCT TAAGGTTATG ACAAATACAT CGTTGGTTAG AGGTATGAAC CTTAGACAAG 
TTATTAATTA CGGACTCAAA AATATTATGA TTg AG CTGGT ATAAATGTTT ATTTC CGATT 150 o 
TTTCGTGTCG TAACTAAGTT GGTTTTTACT AATGCTTTCA TATGrTAGCT AAGTGTAGGT 1560 
TGAGAGAATT GAAAATGTGC TAACAAATCA CAAGCGCATA ACTCTCCACA AGAAAGTAAA 1620 
TCTAGTATTT CTAATCTGCT TGAATCTGAT AAAACTTTTA AAAATGTTGC TAGTT CTTT A 168 0 

TACGT CATAA CATACCTCCT AGACGTTAAA TAGATTATCA TCTATATAGA TGAATGTCTA 174 0 

TGTTCCTTTG GTATATTACA CGATATGACT ATGTAATTTA AATTTGGTTT TAGTATTAAA 1B00 
AGGGTATTAA AGATAAATTA TAGATATTGA TTTTGCAAAA TATACTCTTT GTTCTGCATT 1860 
GAAAAAGG 

20 (2) INFORMATION FOR SEO ID NO: 102: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 15249 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 <D) TOPOLOGY: linear - * . - ■ 



1868 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 102: 



30 





ATTTATGAAA 


TCCATAGCnA 


TAAACATTAT 


TCTTGCATCG 


GCTATACAAA 


CAGTTACCGC 


60 




AAGCAAATTT 


GTATATCAAC 


CTGGAATTGT 


GTTCACGTCA 


ATGGCaAATG 


CCGATGATGT 


120 


35 


GTTATCAGGC 


GATAGTTATT 


TTATGGCTGA 


ATTAAAATCT 


ATTAAG CGTA TTGTTGAAAT 


180 




TCCAGATAAT 


CAAAAAATAT 


ACTGCTTTAT AGATGAAATT TTTAAAGGTA 


CCAACACAAC 


240 




TGAACGAATT 


GCCGCTTCAG 


AATCAGTACT 


ATCATTTTTA 


CATGAAAAAT 


CTAACTTTAG 


300 


40 


AGTTATTG CA 


GCAACACATG 


ATATTGAGTT 


AGCTGAACTC 


TTAAAACAAC 


GTTATGAAAA 


360 




TTACCATTTC 


AATGAGGTAA 


TAGAAAATAA 


TAACATACAT 


TTTGATTACA 


AAATTAAGCC 


420 




TGGCAAAGCA 


AATACACGTA 


ATGCCATCGA 


ATTATTAAAA 


ATCACTTCAT 


TTCCAGCAAA 


480 


45 


AATATATGAA 


CGAGCAAAAG 


ATAATGTCCC 


GAAAATTTAG 


CATTTAACTT 


TAAACATAAA 


540 




AACGTCAGCT 


ATCACATGAC 


AGAAGACTAT 


GAACAGTTTC 


AATAATGTTC 


ATAGTAATCA 


600 


50 


TGTTAATAAC 


TGACGTTTAT 


TTTATT CTG C 


AGAATACTCT 


TCTAAATCTA 


TATTGCTGTG 


660 


CCCATTTAAT 


GCTAAATCAG 


CAAATCGACC 


TTGCTGATAC 


AAATAGTGGC 


CGGCAACGCC 


720 




TATCATTGCA 


GCATTATCTG 


TGCATAATTT 


AGGACTTGGG 


ATAGTTAATT 


GAATGTCATT 


780 
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AACAATTAAT 


CGCTGAACAC 


CAT ATT CTTT 


ACAAGCTTGA 


AT AG CTTT AA 


ACGTGAGCAC 


900 




CTCTACAACA 


CTGTTTTGAA 


AGCTCGTTGC 


TACGTTAGCT 


TCAATGATTG 


GaATATTriT 


960 


5 


TTGTCGTTGA 


TTGTGAAGTT 


GATTGATTAC 


GGCACTTTTC 


AACCCACTAA 


AACTAAAATC 


1020 




ATAACTATCT 


TTATCCAACC 


AAACACGAGG 


GAATGAATAA 


GTATCTTCAC 


CTTCAGCAGC 


1080 


1 0 


CAACCGATCA 


ACTTGTGGAC 


CACCTGGATA 


ATTTAAACCA 


ATTGTTCGTG 


CCACTTTATC 


1140 


ATAAGCCTCA 


CCTACTG CGT 


CATCTCGTGT 


TTCACCAATG 


ACTTCAAATG 


ATAAATGATC 


1200 




CTTCATATAA ACTAATTCAG 


TATGTCCACC 


TGAAACAATA 


AGTGCAATTA 


GCGGGAATGT 


1260 


15 


TAATGGCTCT 


TCTATGTGAT 


TAGCATATAT 


ATGTCCTGCA 


ATATGATGAA 


CAGGAATAAG 


1320 




TGGCTnATCG 


TAAGCAAATG 


CCAATGCTTT 


GGCTGCATTA 


ACACCTATTA 


GTAACGCACC 


1380 




AATTAGTCCA 


GGGCCTTCTG 


TAACCGCTAT 


GGCATCAATA 


TCTTCTATTG 


ATACATCGGC 


1440 


20 


ATCCCCTAGA 


GCCTCGTTTA 


TTGTTGCTGT 


TATACCTTCA 


ACGTGATGTC 


TACTTGCCAC 


1500 




TTCGGGAACG 


ACACCGCCAA 


ATCGTTTATG 


ACTTTCAATC 


TGACTTAAAA 


CTGTATTTGA 


1560 




TAAAATATCT 


CTGCCATTTT 


TTATAACACT 


AACGCTTGTT 


TCATCACAAC 


TTGTTTcAAC 


1620 


25 


AGCTAGTATT 


AATATATCTT 


TAGTCATTTA 


AATTCACCCA 


CATAACCATT 


GCGTCCTCAC 


1680 




CTTCACCATA 


ATAATTTTTA 


CGTTTACCAC 


CATATTGAAA 


TCCTAAATTT 


TCATATACAT 


1740 


30 


GTTGTGCCAC 


TTTATTATTA 


ACTCTTACTT 


CTAAACTCAT 


CACATCACAA 


GTGTGACTTG 


1800 


CATAGTTTAT 


TCCGTATTTT 


AAAAGCATTT 


GACCTAAACC 


ATAGCCTCTA 


TAATTATCAT 


1860 




CGATTGCAAC 


TGTTGTAATT 


TGAGCTTGAT 


CGATAACAAT 


CCATAAACCT 


AAATAACCAA 


1920 


35 


TAATTTGTTG 


TTCAAATTCt 


AAGACAAAAT 


ATTTCGCAAA 


GTTATITTCJC 


TCTATTTCAT 


1980 




GATAAAATGC GTCAATTGTC 


CAAGAACTGT 


CATTGAAACT 


CCGACGCTCA 


AGATCAAAGA 


2040 




CTTQTGGCAC atcttcttta 


GTCATCTCTC 


TAATGTTTAA 


TTGTTCTTTT 


GACTGTTGAT 


2100 


40 


CCAATTTCGT 


TCCGCCTCAG 


CTAATTTATG 


GTATTTAGGA 


GTAAATGTAT 


GTACGTCTGA 


2160 




AGGTTTATCT 


AGCAATTGAT 


ACATGACTGA 


TGCATTTGGT 


AGctGCGCAA 


TCACTTCACC 


2220 




TTGTAATTCA 


TCTTGTAATT 


TTACAGTATC 


TTTCCCAATA 


TAAATAAATG 


GTTGGTTTAA 


2280 


45 


ATCTTCTAAA 


AAAGCTCGCA 


ATGCCTCTAT 


CGACATATAT 


TGATCTTCTA 


AAATAGTCAC 


2340 




TAATTGACCA 


TTTTGCCACT 


GGAATATGCC 


TGTATAAACT 


GCTTGTCGTC 


TTGCATCAAA 


2400 


50 


CACAGGAACC 


AATAATTTAT 


CAGTATGATC 


GATTGTTGCT 


GCCAATGCCT 


TTAATGATGA 


2460 


AACACCATAT 


AATTTAACAT 


CTAACGCATA 


CGCTAATGTT 


TTAGCAACAG 


TAACACCGAT 


2520 




ACGTAAGCCA 


GTATATGAAC 


CAGGACCTTC 


AG CAACAATA 


ATCGCATCTA ATTGCTGTTT 


2580 
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TTGTTTAGAA TCCGTAGTTA TTTCAGCTAA 


AACTTCATCG 


TTTTGCATCA ATGCTACTGA 


2700 




TAATGGTTGA TTCGATGTAT 


CAATG AG CAG 


CGAATTCATG 


CZ A T A A TTP r* r* 


TCCTTAATTT 


2760 


5 


GTTCATAATG TTCTCCTTGC 


GCGAACAACT 


CAATTTGTCT 


iwini ITiCA 


GATATTGTTG 


2820 




AAATGTTAAT AGATAAATGC 


GTCGCTGGAA 


GTAAATCTTT 


trta A A Try* a 

inlnnnl XvjA 


\- 1 LLA J. rCAA 


2880 


10 


TAACAGTAAT TGCCTGATCT 


TCGAAAAATT 


CATCAAATCC 


IMAiL 1 I CA 


TCAGAATCTT 


2940 


CTAAGCGATA ACAATCCATA 


TGATGCAATT 


TTAAATTTTT 


A(_ U v_ CTATAT 


GATTTAATGA 


3000 




TGTTAAATGT CGGGGAATTA 


ATCGTACGTP 


TTACACCAAG 


AGCTTTTCCT 


ATAAATTGCG 


3060 


IS 


TTAACGTTGT TTTACCTGCT 


C CTAAATPT C 


CGTTAAGTAA 


AATCAAATCA 


CCACm-rCA 


3120 




ATTGCTCAAC TAAAAATATA 


w WW\ 1 X un X 


TCATTTCATC 


TAAATTATTT 


ATCTTTATCA 


.3180 




ATGTTGATTC TCCTATATTA 


X vJU X X X X X 


TCATAAAAAT 


GAi 1ATCCAT 


TGTTCAATCG 


3240 


20 


TATCTAACTT TATATTTAAC 


CTTTATATT^ 

^» X X X J^. X X 4 v? 


TAACAAATTT 


^ JV /' pwn tv tv m 

CAftt i x AAAT 


TTCTTATCTT 


3300 




TGAAACAGAT TATCTATTCA 


X X ATI X X \9 


TAAGAAAATT 


TAAAATATTT 


GTTGACATAC 


3360 




TAAAGCAGAT ATAGTAAATT 


X X X n X 


AATTTTTAGA 


IV TV ^nm / »*vv -it *h y« 

CAATTCTAAC 


TATTAAAGTG 


3420 


25 


ATATATACCA TTCACGGAAG 


GAflT ATA ITS 


AAATGCTTAA 


TCAATATACT 


GAACATCAAC 


3480 




CGACAACTTC AAATATTATT 


*» X X X 1A1 X^^X 


ACTCTTTAGG 


ACTCGAACGT 


TAgTAAATAT 


3540 


30 


TTACTAAACG CTTTAAGTCC 


J. X 1 N— X X X 


TGAATGGGAC 


TTGTAAACGT 


CCCAATAATA 


3600 


TTGGGACGTT TTT1"1'ATGTT 




ATTACTTATT 


TTTATTACTA 


TAAAACATGA 


3660 




TTAATCATTA AAATTTACGG 


GGGAATTTAC 


TATGCGAa CG 


AgcATGATCA AAAAAGGAGA 


3720 


35 


TCACCAAGCA CCAGCAAGAA 


GTCTTTTACA 


TGCCACGGGC 


GCGCTAAAAA 


GTCCAACTGA 


3780 




TATGAACAAA CCATTTGTAG 


CTATTTGTAA 


CTCTTATATT 


GATATTGTTC 


CTGGACATGT 


3840 




TCACTTGAGA GAGCTTGCAG 


ATATAGCTAA 


AGAAGCAATT 


AGAGAAGCCG 


GTGCCATTCC 


3900 


40 


ATTTGAATTC AATACAATTG 


GTGTTGATGA 


TGGAATAGGT 


ATGGGACATA 


TCGGAATGCG 


JV960 




ATATTCTCTA CCATCACGTG 


AAATTATTGC AGATGCAGCT 


GAAACTGTAA 


TTAACGCTCA 


4020 




TTGGTTTGAC GGCGTATTTT 


ACATTCCTAA 


TTGTGACAAG 


ATTACACCCG 


GTATGATTTT 


4080 


45 


AG CAG CCATG AGGACAAACG 


TACCAGCTAT 


CTTTTGCTCT 


GGTGGACCAA 


TGAAAGCTGG 


4140 




CTTATCTGCA CATGGAAAAG 


CATTAACACT 


TTCATCAATG 


TTTGAAGCAG 


TCGGCGCATT 


4200 


SO 


TAAAGAAGGA TCGATTTCTA 


AAGAAGAATT 


TTTAGATATG 


GAACAAAATG 


CCTGCCCTAC 


4260 


TTGTGGTTCA TGTGCTGGGA 


TGTTTACTGC 


AAATTCAATG 


AACTGTTTGA 


TGGAAGTTTT 


4320 




AGGTCTAGCA TTACCATACA 


ACGGTACTGC 


ACTTGCAGTC 


AGTGATCAGC 


GACGAGAAAT 


4380 
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TATCGTTACT 
AACAAACACG 
AGAGCGCATT 
ATCGTATTCA 
GATGAAGAAA 
TGAAAATAAC 
ATATGATGCA 
TATTAAAGTT 
CAATTCGCAT 
CGTTGTCATT 
TACTTCCTCT 
TTTTTCCGGT 
TGGACCAATT 
ATTAAACGTA 
TAAAGCGAAA 
TACAGGTGGC 
GGTTAAAATG 
TGAATCACTT 
AGAAGTGCTA 
TGGTGCCGTA 
AAG^CACGAA 
GGCGTCGTTG 
GCACATTGCG 
GGTAAAGATG 
AATTATCAAG 
GCTAATTCTG 
GCTACAAATG 
CCAGAAAATA 
GTATTAGCCG 



CGCGAAgCAA 
GTACTGCATA 
AATGCTATTG 
ATGCATGATG 
GATGGCACGT 
GAAGGCAAAG 
CAAGGCGGTT 
GGCGGCGTTG 
GATGAAGCTG 
AGATATGAAG 
ATTGTTGGTC 
GCCACAAGAG 
GCCTTAATTG 
AACCAGCCTG 
GTAAAAACAG 
GTCATGCAAG 
TCTAAAACTC 
GAACCTGAAC 
GTAGAAGCTC 
CT AC CTTT AT 
CAAGGTGCTG 
TAGTTACAAG 
ACTCTTTACC 
CATTCCAAGA 
TGAAACGTGT 
GACGCAAAGG 
TGGATTTATG 
AAGACATTGA 
GCGCAGGTAT 



TTGATGATGC 
CGTTAGCCAT 
CCAAACGCAC 
TGCATGAAGC 
TACACCCAGA 
AAATTAAGAA 
TATCTATCTT 
ATCCATCTAT 
TTGAAGCAAT 
GACCTAAAGG 
GCGG CTTAGG 
GTATTGCAGT 
AAGATGGTGA 
AAGATGTTCT 
GTTATCTAGC 
TCCCTGAGAA 
AACATGAAGT 
AACTAAATGA 
TACTTAAAGA 
ATGACACGTT 
TTCATGCTGC 
CGGTCCaGGT 
TCTAGTTGTA 
AGCGGATATT 
TGAAGATATC 
TCCTGTAGTG 
CGACGAAATC 
CACTTTCATC 
TAATCAATCA 



ATTTGCACTT 
TGCCAATGAA 
GCCATATTTA 
TGGTGGCGTC 
TAGAATCACA 
CTTTGATGTC 
ATTTGGTAAT 
CAAAACATTT 
AGACAATCGT 
TGGACCAGGT 
TAAAGATGTT 
TGGTCATATT 
TGAGATTACT 
AGCGCGTCGC 
TCGTTATACT 
TTTAATTTAA 
AAACCAAAAT 
AAAAACTTTA 
AAATGTGGAT 
TTATGATGGT 
AGAAGGTTAT 
GCAACTAATG 
TTCACTGGAC 
CTATCTATGA 
CCTAAAATCG 
ATTGATTTTC 
AATATTCCAG 
TCACTTTTAA 
AAATCAAATC 



GATATGGCTA 
GCTGGTATTG 
TCAAAAATAG 
C CAGCAATT A 
GTTACTGGCA 
ATTCACCCTC 
ATCGCCCCTA 
ACTGGGAAAG 
ACCGTTCGTG 
ATGCCTGAAA 
GCATTAATTA 
TCCCCTGAAG 
ATTGATTTAA 
CGAGAATCTT 
GCCCTAGTAA 
TTTATTTTTA 
ATTGACCCTT 
AATGATATGC 
TATTTATTCG 
AAAATCAAAC 
GCACGTGTAT 
TAATGACAGG 
AAGTTGCTAC 
CTTCACCAAT 
TACACGAAGC 
CAAAAGATAT 
GTTATGAAGT 
AAGAAGCGAA 
AATTATTAAC 



TGGGTGGTTC 
ATTATGACTT 
CACCTAGTTC 
TTAATGAATT 
AAACGTTACG 
TTGATGCACC 
AAGGCGCAGT 
CAATTTGTTT 
CAGGCCACGT 
TGTTAGCACC 
CTGATGGGCG 
CTGCATCTGG 
CAAATCGTAC 
TAACACCATT 
CTAGCGCAAA 
TATTGGAGAT 
TAAAAATGGC 
GTTCAGGATC 
GTTATCCTGG 
ATATTTTAGC 
CTGGTAAamT 
TATTACGGAT 
ACCAGGCATT 
TACAAAACAA 
TTTCCATGTA 
GGGTGTTTTA 
TGTTACAGAA 
AAAGCCTGTC 
ACAGTTTGTT 
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GATACACTAT TTTTAGG TAT GGGAGGAATG CATGGTTCTT ATGCTAGTAA CATGGCATTA 
ACTGAGTGTG ATTTACTCAT TAATTTAGGT AGCCG CTTCG ATGATAGATT AGCAAGCAAA 
CCTGATGCCT TTGCACCTAA CGCCAAAATT GTACATGTAG ATATTGATCC TTCAGAAATC 
AATAAAGTTA TTCATGTAGA TTTAGGTATT ATTGCAGACT GTAAAAGATT TTTAGAATGT 
TTAAATGATA AAAATGTTGA GACTATAGAA CACAGTGACT GGGTTAAACA TTGTCAAAAT 
AATAAGCAGA AACACCCATT TAAACTTGGT GAAGAAGATC AAGTATTTTG TAAGCCACAA 
CAAACAATCG AATATATCGG CAAAATTACA AATGGTGAAG CAATTGTTAC TACAGACGTG 



6780 
6840 



7020 
7080 
7140 
7200 



ACAAGCGGTG GTTTAGGAAC AATGGGATTC GGTATTCCTT CGTCAATTGG TGCCAAATTA 
GCTAATCCTG ATAAAACAGT CGTATGTTTC GTCGGTGACG GTGGTTTCCA AATGACAAAC 

20 CAAGAAATGG CACTTTTACC CGAATATGGT TTAGATGTCA AAATCGTACT AATCAATAAT 6900 

GGAACATTAG GTATGGTTAA ACAATGGCAA GATAAGTTCT TTAATCAACG CTTCTCACAC 6960 
TCAGTATTTA ATGGTCAACC TGATTTTATG AAAATGGCAG AAGCATATGG CGTCAAAGGT 

25 TTCTTAATCG ATAAGCCAGA ACAACTGGAA GAACAATTAG ATGCAGCGTT TGCTTATCAA 

GGACCAGCTT TAATTGAGGT TCGTATTTCC CCTACTGAAG CTGTAACCCC AATGGTTCCG 
AGTGGCAAAT CAAATCATGA AATGGAGGGC TTATAATGAC AAGAATTCTT AAATTACAAG 
TTGCGGATCA AGTCAGCACG CTAAATCGAA TTACAAGTGC TTTTGTTCGC CTACAATATA 7260 
ATATCGATAC ATTACATGTt ACACATTCTG AACAACCTGG GATTTCTAAC ATGGAAATTC 7320 

^ AAGTCGATAT TCAAGATGAT ACATCACTTC ATATATTAAT TAAAAAATTA AAACAACAAA 7380 

TTAATGTTTT AACGGTTGAA TGCTACGACC TTGTTGATAA CGAAGCTTAA TTTTAAGACA 7440 
aaggCaatga TGCGCTAATT AGTTATAGAT ATATCATAGG CTGCTAGTTA ACATCTGCCA 7500 

40 CTATTACAAA GTTATATTTC AGAATTTTCG AAACACAAAA TATTTAATTA TTTGGAGGAA 7560 
TTTATTATGA CAACAGTTTA TTATGATCAA GATGTAAAAA CGGACGCTTT ACAAGGCAAA 
AAAATTGCAG TAGTAGGTTA TGGATCACAA GGTCACGCGC ATGCACAAAA CTTAAAAGAC 

45 AATGGATATG ATGTAGTCAT CGGCATTCGC CCAGGTCGTT CTTTTGACAA AGCTAAAGAA 

GATGGATTTG ATGTGTTCCC TGTTGCAGAA GCAGTTAAGC AAGCTGATGT AATTATGGTG 7 800 

CTATTACCTG ATGAAATTCA AGGTGATGTA TACAAAAACG AAATTGAACC AAATTTAGAA 7860 

50 

AAACATAATG CGCTTGCATT TGCTCATGGC TTTAACATTC ATTTTGGTGT TATTCAACCA 7 920 

CCAGCTGATG TTGATGTATT TTTAGT AG CT CCTAAAGGAC CGGGTCATTT AGTTAGACGT 
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CAAGCACGTA ATATTGCTTT AAGTTATGCA AAAGGTATTG GTGCAaCTCG TG CAGGTGTT 8100 

ATTGAAACAA CATTTAAAGA AGAAACTGAG ACAGATTTAT TTGGTGAACA AGCAGTACTT 8160 

TGCGGTGGTG TATCGAAATT AATTCAAAGT GGCTTTGAAA CATTAGTAGA AGCGGGTTAT 8220 

CAACCAGAAT TAGCTTATTT TGAAGTATTA CATGAAATGA AATTAATCGT TGATTTGATG 8280 

TATGAAGGCG GTATGGAAAA TGTACGTTAC TCAATTTCAA ATACTGCTGA ATTTGGTGAC 834 0 

TATGTTTCAG GACCACGTGT TATCACACCA GATGTTAAAG AAAATATGAA AG CTGTATTA 84 00 

ACTGATATCC AAAATGGTAA CTTCAGTAAT CGCTTTATCG AAGACAATAA AAATGGATTC 84 60 

AAAGAATTTT ATAAATTACG CGAAGAACAA CATGGTCATC AAATTGAAAA AGTTGGTCGT 8520 

GAATTACGCG AAATGATGCC TTTTATTAAA TCTAAAAGCA TTGAAAAATA AGATAGACCT 858 0 

ACAATGAGGA GTTGTTAAAT ATGAGTAGTC ATATTCAAAT TTTTGATACG ACACTAAGAG 864 0 

20 ACGGTGaACA AACACCAGGA GTGAATTTTA CTTTTGATGA ACGCTTGCGT ATTGCATTGC 8700 

AATTAGAAAA ATGGGGTGTA GATGTTATTG AAGCTGGATT TCCTGCTTCA AGTACAGGTA 876 0 

GCTTTAAATC TGTTCAAGCA ATTGCACAAA CATTAACAAC AACGGCTGTA TGTGGTTTAG 8820 

25 CTAGATGTAA AAAATCTGAC ATCGATGCTG TATATGAAGC AACAAAAGAT GCAGCGAAgC 8880 

CGGTcGTGCA TGTTTTTATA GCAACATCAC CTATTCATCT TGAACATAAA CTTAAAATGT 8940 

CTCAAGAAGA CGTTTTAGCA TCTATTAAAG AACATGTCAC ATACGCGAAA CAATTATTTG 9000 

ACGTTGTTCA ATTTTCACCT GAAGATGCAA CGCGTACTGA ATT AC CATT C TTAGTGAAAT 9060 

GTGTACAAAC TG CCGTTGAC GCTGGAGCTA CAGTTATTAA TATTCCTGAT ACAGTCGGCT 9120 

ACAGTTACCA TGATGAATAT GCACATATTT TCAAAACCTT AACAGAATCT GTAACATCTT 9180 

CAAATGAAAT TATTTATAGT GCTCATTGCC ATGACGATTT AGGAATGGCT GTTTCAAATA 924 0 

GTTTAGCTGC AATTGAAGGC GGTGCGAGAC GAATTGAAGG CACTGTAAAT GGTATTGGTG 9300 

AACGAGCAGG TAATGCAGCA CTTGAAGAAG TCGCGCTTGC ACTATACGTT CGAAATGATC 9360 

ATTATGGTGC TCAAACTGCT CTTAATCTCG AAGAAACTAA AAAAACATCG GATTTAATTT 9420 

CAAGATATGC AGGTATTCGA GTGCCTAGAA ATAAAGCAAT TGTTGGCCAA AATGCATTTA 94 80 

45 GTCATGAATC AGGTATTCAC CAAGATGGCG TATTAAAACA TCGTGAAACA TATGAAATTA 954 0 

TGACACCTCA ACTTGTTGGT GTAAGCACGA CTGAACTTCC ATTAGGAAAA TTATCTGGTA 96 00 

AACACGCCTT CTCAGAGAAG TTAAAAGCAT TAGGTTATGA CATTGATAAA GAAGCGCAAA 966 0 

50 TAGATTTATT TAAACAATTC AAGGCCATTG CGGACAAAAA GAAATCTGTT TCAGATAGAG 9720 

ATATTCATGC GATTATTCAA GGTTCTGAGC ATGAGCATCA AGCACTTTAT AAATTGGAAA 9780 
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AAGAGGGTCA TATTTACCAG GATTCAAGTA TTGGTACTGG TTCAATCGTA GCAATTTACA 
ATGCAGTTGA TCGTATTTTC CAGAAAGAAA CAGAATTAAT TGATTATCGT ATTAATTCTG 
TCACTGAAGG TACTGATGCC CAAGCAGAAG TACATGTAAA TTTATTGATT GAAGGTAAGA 
CTGTCAATGG CTTTGGTATT GATCATGATA TTTTACAAGC CTCTTGTAAA GCATACGTAG 
AAGCACATGC TAAATTTGCA GCTGAAAATG TTGAGAAGGT AGGTAATTAA TTATGACTTA 
TAACATTGTT GCCCTACCTG GTGATGGAAT CGGTCCAGAA ATTTTGAACG GATCTCTATC 
ATTGCTTGAA ATTATAAGTA ATAAATATAA CTTTAATTAT CAAATAGAGC ACCACGAATT 
,5 TGGTGGTGCC TCTATTGATA CATTCGGCGA GCCTTTAACT GAGAAAACCT TAAATGCGTG 10320 



T AAAAG AG CA GATGCTATTT TACTGGGTGC AATCGGTGGA CCTAAATGGA CAGATCCTAA 
CAATCGACCA GAACAAGGAT TATTAAAATT GCGTAAATCC TTAAATTTAT TTGTAAATAT 
20 ACGCCCCACT ACCGTTGTCA AAGGCGCTAG TTCTTTATCA CCTTTAAAGG AAGAACGCGT 

TGAAGGCACA GATTTAGTTA TAGTC CGTGA ATTGACAAGT GGTATTTATT TTGGAGAACC 
TAGACATTTT AATAATCACG AGGC CTT AG A TTCTCTTACT TATACAAGAG AAGAAATAGA 
ACGCATTGTT CACGTAGCAT TTAAATTGGC CGCTTCAAGA CGAGGAAAAC TAACATCAGT 
TGATAAAGAA AATGTATTAG CTTCTAGTAA ATTGTGGCGC AAAGTCGTAA ATGAAGTAAG 
TCAATTATAT CCAGAAGTAA CAGTAAATCA CTTATTTGTT GATGCTTGTA GTATG CATTT 
AATCACAAAT CCAAAACAAT TTGACGTCAT CGTATGTGAA AACTTATTTG GCGATATTTT 
AAGTGATGAA GCTTCAGTGA TTCCTGGTTC ACTTGGTTTA TCACCTTCTG CTAGTTTTAG 
35 TAACGATGGT CCAAGATTGT ATG AG C CTAT TCATGGATCA GCACCAGATA TTGCAGGTAA 

AAACGTTGCC AATCCATTTG GAATGATTCT ATCTTTAGCG ATGTGTTTAC GTGAAAGCTT 
AAATCAACCA GATGCTGCAG ATGAATTAGA ACAACATATT TATAGCATGA TTGAACATGG 
40 GCAAACGACA GCAGATTTAG GCGGCAAATT GAATACTACT GAT A TTTTCG AAATTCTATC 

TCAAAAATTG AATCACTAAG GGGGAGATGT AAATGGGTCA AACATTATTT GACAAGGTGT 
GGAACAGACA TGTGTTATAC GGGAAATTGG GCGAACCGCA ACTATTATAC ATTGATTTAC 
ACCTTATACA TGAAGTTACT TCTCCTCAAG CATTTGAAGG ACTTAGGCTT CAAAACAGAA 
AATTAAGACG CCCAGATTTA ACATTTGCAA CACTCGATCA CAATGTTCCT ACTATTGATA 
TATTCAATAT TAAAGATGAA ATTGCAAACA AACAAATCAC AACATTACAA AAAAACGCCA 
TAGATTTTGG GGTGCATATT TTTGATATGG GTTCTGATGA ACAAGGTATT GTTCACATGG 
TAGGACCTGA GACAGGACTT ACACAGCCTG GCAAGACAAT CGTTTGTGGT GACTCTCACA 
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ATGTTTTCG C 
ATGGTACCTT 
ATGGTGTTGA 
TTTCAATGGA 
GCATAATCCA 
ACTtCGCTAA 
ATCGTGTAAT 
CTGAAATGGG 
GTGCGTATGA 
ATGTTTTTCT 
TTGTTAAAGG 
CAGTAAAAAA 
AATGGCGTGA 
GCGTACATTG 
GAACACATTT 
ACGTAAGAAA 
AAATAGTCCC 
TAAAGCGTAT 
CTGATGGTTC 
TTTTAATTAC 
TTAAGGACTA 
ATTGCACTAA 
CACAATATGT 
GTTTCCATTT 
TTGCAATCAC 
GTTGAATATT 
AAGACTTAAA 
GTATGATTGT 
AAGAGGTGCT 



AACTCAAACG 
ACCAACAGGC 
CTTTGGTACA 
TGGTCGAATG 
ACCTGATGAT 
ATCAGTTGAT 
TGAACTTGAT 
TGTTAATTTC 
TTATATGGGG 
CGGTTCATGT 
AAATAAAGTT 
AGAAGCAGAA 
AC CAGGATGT 
TGCATCTACA 
AGTATCCCcT 
GGTGGTTGTT 
TCTCTTCAAC 
TTCAAAAAGT 
AGATAATCCT 
TGGAGATAAT 
TGGTTTTCAT 
AAATGCGATG 
TGAAATTGAG 
TGAAATTGAT 
C CT ACAAT AT 
ATGACAGTCA 
GATATTGTCA 
AAAGTCTATT 
TACAACGCTA 



CTATGGCAAA 
GTCTATGCTA 
GGCTATGCTT 
ACTATTTGTA 
ATAACATTTG 
AAGTGGCGTG 
GTTTCAACAT 
AGTGAACCAT 
TTAGAACCAG 
ACAAATGCTA 
CATCCAAATA 
AAATTAGGTC 
TCAATGTGTT 
AGTAATCGAA 
GCTATGGCAG 
TAAATGGCAG 
GACAATATCG 
GGCTTTGGTC 
GATTTCAATC 
TTTGGATGTG 
ATTATTATTG 
TTGCCTATCG 
GTCGATTTAC 
GAAACTTGGA 
GAATCATTAA 
AAACAACAGT 
AAGAAACACC 
TAAAACGAGA 
TTTCTGTTTT 



CAAAACCCAA 
AGGACATTAT 
TGGAATTTAC 
ACATGGCTAT 
AATATGTTAA 
AgCTATATTC 
TAGAACCACA 
TCCCTGAAAT 
GTCAAAAAGC 
GACTATCAGA 
TTACAGCTAT 
TAGATACTAT 
TAGGCATGAA 
ACTTTGAAGG 
CAGCAGCAGC 
CAATCAAACC 
ATACAGACCA 
CATTTGCTTT 
CTAACAAACC 
GTTCAAGTCG 
CAGGAAGTTT 
TTTTAGAAAA 
CAAATCAAAC 
AGAATAAACT 
TAGAAAAATA 
TTCTACGAAA 
TTTACAATTA 
AGATTTACAA 
ATCAGATGAA 



AAACTTAAAA 
TCTGCATTTA 
TGGCGAAACA 
CGAAGGTGGT 
AGGGAGACCA 
TGATGACGAC 
AGTGACATGG 
CAATGATATC 
TGAAGACATC 
TTTGATTGAA 
TGTCGTACCA 
CTTTAAAAAT 
TCCTGACCAA 
ACGACAAGGC 
TATTCATGGT 
TATTACAACA 
AATCATTCCT 
TGATGAATGG 
ACAATATAAA 
TGAACATGCT 
CAGTGACATA 
AAGTGCCCGT 
TGTGTCATCA 
TGTAAATGGC 
TGAAAAATCa 
GAT AT CGATG 
GACCATTACT 
TGGGTACGTT 
GCTAAAAGTA 



ATCGATATTA 
ATTAAAACGT 
ATTAAAAACC 
GCCAAATACG 
TTTGCCGATA 
GCGATATTTG 
GGAACTAATC 
AACGATCAAC 
GACTTAGGGT 
GCTAGTCATA 
GGTTCTCGTA 
GCAGGATTTG 
GTACCTGAGG 
AAAGGTGCAA 
AAATTTGTGG 
TATAAAGGTA 
AAGGTACACT 
CGGTACTTAC 
GGGGCTTCTA 
GCTTGGGCTC 
TTTTATATGA 
GAACATCTTG 
CCAGACAAGC 
TTAGATGACA 
CTTTAAGGGA 
AGGCATTTTT 
TATCTCAAAA 
CTTTTAAATT 
AAGGTATTAC 
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AAACGCTGTT ATCTTTATGC CAGTCACTAC ACCTTTACAA AAGGTAAATC AAGTAAAGTT 
CTTTGGAAAT AGTAACGTTG AAGTTGTACT CACTGGTGAT ACATTTGATC ACTGTTTAGC 
TGAAGCTTTA ACTTATACAA GTGAACATCA AATGAACTTT ATAGATCCAT TCAATAATGT 
TCATACAATT TCTGGACAAG GTACGCTTGC TAAAGAAATG CTAGAACAAG CAAAGTCTGA 
CAATGTTAAC TTTGATTATC TATTTGCCGC AATTGGTGGT GGCGGTTTAA TTTCAGGTAT 
TAGTACTTAC TTTAAAACCT ATTCACCTAC CACGAAAATT ATAGGTGTTG AACCTTCAGG 
TGCAAGTAGT ATGTATGAAT CTGTTG TGGT AAATAATCAG GTAGTCACAT TGCCTAATAT 
CGATAAATTT GTGGACGGTG CATCTGTAGC TAGAGTTGG C GATATTACAT TTGAAATTGC 
AAAAGAAAAT GTAGATGATT ACGTTCAAGT AGATGAAGGT GCAGTTTGTT CTACGATTTT 
AGATATGTAT TCAAAACAAG CAATTGTAGC AGAACCTGCT GGCGGATTAA GTGTAAGTGC 
2Q GCTTGAAAAC TATAAAGATC ATATTAAAGG TAAAACAGTG GTTTCTGTCA TTAGTGGTGG 

TAATAATGAT ATTAATCGAA TGAAAGAAAT TGAAGAACGT TCATTACTAT ACGAAGAAAT 
GAAGCATTAC TTTATCTTAA ATTTCCCTCA ACGTCCAGGT GCATTGAGAG AATTTGTAAA 
25 TGACGTATTA GGACCTCAAG ACGATATTAC TAAATTTGAA TACTTAAAAA AATCTTCTCA 

AAATACAGGT ACTGTCATTA TTGGTATTCA ACTTAAAGAT CATGATGATT TAATACAACT 
CAAACAACGT GTAAAt CATT TCGATCCTTC CAATATTTAT ATTAATGAAA ATAAGATGTT 

30 

ATATTCATTG TTAATTTAAC ACATAGTAAG AAAAACAGTC ATAAATTGAT TTCTAATTGA 
AATCATCTTA TGACTGCTTT TTATTATACT TTACATTTCT CGTTTCGTCA GATTCAAACG 
35 TTTTCACTTC GCCAAGCCAT CTTTCTTTGT GTTTGCTTTT aTTTTGACGT TTTAGACATA 

AAAAAaGAGA CCTTGCGGTC TCAATGCGGC TCATCGCATC CACTTTTTGC CTGGCAACGT 
TCTACTCTAG CGGAACGTAA GTTCGaCTAC CATCGACGCT AAGGAGCTTA ACTTCTGTGT 

TACATTCAAA ACTAGATAGT AAGTAAAAGT GATTTTGCTT CGCAAAACAT TTATTTTGAT 
TAAGTCTTCG ATCGATTAGT ATTCGTCAGC TCCACATGTC ACCATGCTTC CACCTCGAAC 
45 CTATTAACCT CATCATCTTT GAGGGATCTT ATAACCGAAG TTGGGAAATC TCATCTTGAG 

GGGGGCTTCA TGCTTAGATG CTTTCAGCAC TTATCCCGTC CACACATAGC TACCCAGCTA 
TGCCGTTGGC ACGACAACTG GTACACCAGA GGTATGTCCA TCCCGGTCCT CTCGTACTAA 
GGACAGCTCC TCTCAAATTT CCTACGCCCA CGACGGATAG GGACOGAACT GTCTCACGAC 
GTTCTGAACC CAGCTCGCGT ACCGCTTTaA TGGGCGAACA GCCCAACCCT TGGGACCGAC 



13500 
13560 
13620 
13680 
13740 
13800 
13860 



55 



BN STOOD: <EP 0786519A2_I_> 



608 



EP 0 786 519 A2 



GTGGAACTT 

(2) INFORMATION FOR SEQ ID NO: 103: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14051 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 103: 
GTGGCAATAT TTCTAGTTCT CGTTTTGATA AGATTTTAAA AGGATCTGTT GTGTTTGCAG 
TGTCCTGATT TGAATTAGAT ACAAATTCAT TCACTAAAGA TGTTGTAAGT TTCATATCTA 
CATATGTTTC ACCTTTATAT ACAGTTCGAA TAGCTAACAA TAATTGTTCA TCAGGTG CAT 
TTTTCAATAT GTAACCTTTC GCACCATTAC GCAACACATG GAACAAATAC TCCTCATCAT 
CAAACATTGT TAATATTAGT ATTTTAGTTT CAGGAAAACT GTCAGCAATT TTACTCGTAG 
CGATAAGACC TGACTCACCT GGTGG CATAC TTAAATCCAT TAGTAACACA TCAGGTTTAt 
ATT C CATTAC TTTTTGGTAA GCTTCGACGC CATCTGCAGC CGTTGCAACA ACTTCCATAT 
CATTTTGATA ATTTAAAATC ATAGAGAACC CCGTACGGAC AACAGCGTGA TCATCGGCAA 
TGACTATTTT CAATTTTATT CCCCCAATGT ATGTTTCAAA TTGGAATGTT CAATGTAACA 
TTGGTACCCT CACCAATTTT CGTTTCAATA TTGACGCTAC CGCTGACTAA CTCAGCTCGC . 
TCATTCATTC CAT ATAAAC C GAGTCCAGAA CCTTTAGGCT TAGAACTTGG ATCAAAACCA 
TTTCCCGCAT CTATCACTTC TGCTACCAAA TGGCGCCCAG TTTGACGGAT ACCTACATTT 
ATTTCATTTA CATCAGCGTA TTTCAACGCA TTTAAAATAG CTTCTTGCAC TACTCGATAA 
ACAACCGTTT CAATATCACT ATCAAAGCGA GTATTTTTAA TATTTGATGT ATATATGATT 
TTTATTCCAT AATTTTCTTC AAACTGTTTA AAATATGATT TAAAAGCTGC TTCAAGGCCT 
AGATCATCCA AAGAAGCGGG TCTTAATTCA ACCGACATAT TACGTATATC ATCAATTAAT 
TTAGCGACAA TATATTCAAT ATTTTCTGCG TCTTCCAAAA GCTTAGTTGT ATCTTCTTGA 
TATTTTAATA ATCTCAATTG AACATCTACA TTGAGCATTT CTTGAATCAC ACTATCATGT 
AACTCTCTAG AAATTCGCTT TCTTTCATTT TCTTGGGCTG AGATTGTTTT ACGCATCATA 
CGTTGTTGAT GCAATTTCTC TTGCTGTTCA ATTTGTGATG AAACATTTTG AAGCGTAAAT 
GCATGAATTC CCCTGTCTTG ATCAATCAAC TGATATGTTG CTGTAAATGG CATCACTTTT 
TGATCTTTCG TCTTCATAAA TACTTGGAAA TTCGTAGCTT GTACTTGCAT CGATTCTAAG 



609 



10 



IS 



20 



30 



35 



EP 0 786 519 A2 

ATCGCATTCG CCACAGCACT GTAATTATCT TCTTCAGATA AT ATAT CTTT AGCAGCATCA " 144 0 

TTCATTGCAA TAATTTT AC C GTTATCATCA GCAAAAACTA TCTTTTCGAT TGAATGCTCA 1500 

TAATATTTTT TCAATAAAGT ATCTAACTGT ATACTGTCCT CATTAATCAT GACTTACACC 15 60 

CTAATTCATC TCATTATTTA TCATCATTGA AAATACCAAA CTTACGTTGA ATATCATCAT 1620 

TATCAAATAT TTTTGGTAAA GG ACGAC CAT CTCTTTGACC AAATAATAGT ACGCCATACA 1680 

CTTGATTCTT ATACCAAAGC GGCACTGCTA AAACTGCTGT TAATGATTCG CTCAATAAAA 174 0 

TTGGATAGTC AATCTTTTCT TCAGG CCCTA AAGCTAAACC AACATTGGCT ATT AC CATAC 18 00 

GCTTTCCTGT TTTCATAACA GTTCCAGCTA ATCCACGACC TTTTCTTAAA ATAATCAATT 1860 

TAAATCGATT ATTTTTATTA CCTGAAACAT AGTGCCATTT TATTGGAGAT GATGGTTTGT 1920 

TAGATTCATA GAAAGCGATT GCCGCAAAAT CATAACCCTC TTCTTTGCGT ATTTTATCTA 1980 

ATGTCTCTTG AAATCTACGA TCTTCAATTA TTGCTTCTGG TGTCAAATCC TTTCACCTCT 204 0 

TATGCTTACA CTTT ATT CTT ACGGTAAATA ATATATCTGC GATTTATATA TGTCAAAGGT 2100 

ACACTCCAAA CATGCACCAA ACGTGTAAAT GG CCAACAAG * C CAT AAT AGT GAAACCTAAC 2160 

25 AATATATGCA TTTTAAATGC AATCGGCACA CCACTCATCA ATGACGC^TC TGGTTTTAAC 2220 

ATAAATAATT GTCTAAACCA AATTGATAAT GAAGTTCTGT AGTTAAAGTC TGGATGTTGT 2280 

ATATTTGTTA CTAATGTTGC GTAACATCCC ATAAATACGA TAAGTAATAA TAAGAAATTT 234 0 

ACAAATATAT CCGACGCTGA ACTTAATCTT CGAATACTTT TCGTAGTAAC ACGTCTCGCT 24 00 

GTTAATAAAA ACATCCCTAT CAAAGTTATT ATACCAAAGA TGCTACCAAT ATAAACAGCG 24 60 

C CTATATG AT ATAAATGCTC AGACACACCC ACTGCATCCA TCCATGGTTT CGGTATTAAC 252 0 

AATCCAACTA CGTGTCCAAA AAACACTGGA ATAATACCTA AGTGAAATAA TAAACTTCCC 2580 

CACATCAACC TTTTTCTTTC TATTAATTCA CTAGATTTAG CTGTCCAAGA AAATTTATCA 2640 

40 TAACGATAAC GTGCAATATG ACCTGCGACA AAGACAACTA AACATAAATA CGGAAATATA 2700 



ACCCATAAAA ACTGATTAAG CATGATGTTT CACTCCTTTT GGTGATGTCA AACATAATTT 2760 

CAATGTTTTT CTAAGTGCTT GAATCACATA GG CAT ATGGA TTGTTATCTT CACCAAGTGC 2 820 

45 ATTCGCCATC ACATATGTTC CATCCTCAAT AATCATAATG ATTAATTGAA TATTCTCTTC 2880 

AGCTCTTGGA TCATTTCGCC ATTCTGCCAC TTGCAAAAAT TGAAGCATCA ACGGTAGATA 2 94 0 

ATCAGAAAGT TCATTATCTA CCATTTCTAG TCCAAACATT TCATATAATA CCTTTAATTT 3000 

50 AGCTAACATT TGCCCACGTT CTTTTTGCGT ATCAAATTTG TTATACGTCA TATATAATGG 3 060 

TGCTTTTTTC GTAAAATCAA ATGTATCTGT ATAAATCGCT TTGATTTCTG ATAATGAAAA 3120 
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TGTTTCTTCA AAAGTTTTTG GATGAAAAGT TAATTTTTCT GGAAAACATA ACTGTTGTGC 3240 

CATATATCCA AAACTTTCTT GATATTTTTT AAAATTATCG AAATTAATCA CGGAAAATCC 33 00 

CTCCATAGAA ATTCTCATTA TAAATTTCTT GACCAGTTTT CCCTGAACCT ACTGCAACGC 3360 

CACAGCCTTC ACAGTTATCT CCAAAATGCT CGCCGCCGTA ATTGTATCCT GTACTACCTT 3420 

GTGCGTGATA CGTATCTAAA TAGGTTTCTT TGTGTGATGT TGGAATAACA AATCGATCTT 34 80 

CATATTTGGC TAGTCCTAAT AAACGATACA TGTCTTTAGT TTGGCGCTCG GTTATACCTA 3540 

ATCGCTCTAA TCGAGA CGTG TCAAATGGCT GTTGAGTAAC TTGAGATCTC AT AT AACTT C 3 600 

TCATCATTGC CATACGTTGT AGGGCTCCTT TTACTGGCTC TGTATCTCCT GCAGTGAAAA 3 660 

TATTAGCTAA GTATTCAATA GGTAAACGCA TTTCTTCAAT GGCTGGGAAA ATCGCATCTG 3720 

GATTTTGAGT TGTATTTTTA CCTTCAAAAT AGCTCATAAT TGGGCTAAGT GGTGGGCAAT 3 780 

20 ACCAAACCAT CGGCATCGTT CTAAATTCAG GATGTAACGG AAATGCAAGT TTATATTCAA 3 84 0 

TTGCTAACTT ATAAATTGGA GAGTTTTGTG CAGCTTCAAT CCAATCGTAA CCAATACCAT 3 900 

CTTTTTCAGC TTGAGCAATG ACTTCTTCGT CAAATGGGTT TAAGAATATA TCTAATTGTT 3 960 

TTTCATATAA ATCTTTCTCG TCTACTGCTG AAGCTGCTTC ATGAACTCGA TCTGCATCAT 4 020 

ATAATAAAAC ACCTAAGTAA CGCATACGTC CTGTACAAGT TTCAGAGCAT ACCGTAGGCA 4 080 

TACCCGCCTC GATT CTCGGG AAACAGAAAG TACACTTTTC AGCTTTGTTC GTTTTCCAAT 414 0 

TGAAGTAAAC TTTCTTATAT GGACAACCTG TCATACAGTA ACGCCATCCA CGACATGCGT 4 200 

CTTGGTCAAC TAATACAATG CCATCTTCAT CACGTTTATA CATAGCACCT GAAGGACACG 4 260 

ATGCAACGCA ACTTGGATTC AAGCAATGTT CA CAT AAACG TGGTAAATAC ATCATAAAAG 4 320 

TTTCGTCAAA TTGGAATTTA ATATCTTCTT CTATTTTTTG GATGTTAGGA TCTTTTGGAC 4 3 80 

CTGfAACATG ACCACCTGCT AAGTCATCTT CCCAGTTAGG TCCCCATTCA ATTTCAATGT 4440 

TATCCCCCGT AATTTCTGAA TACGCTCTAG CAACTGGCGA ATGCTTCCCT GATTTCGCAG 4 500 

TTGTTAAATG TT CATAATT A TAGTTC CATG GCTCATAATA ATCTTTAATT AATGGCATAT 4560 

CTGGGTTATA AAAAATTTTA CCTAAAGCAA TTTTTGAAAT TCTACTTCCA GATTTTAATT 4620 

45 CAAGTTTCCC TTTACGATTT AGTACCCAAC CACCTTTGTA GTGTTCTTGG TCTTCCCAAC 46 80 

GTTTCGGATA CCCTACACCT GGCCTCGTTT CTACGTTGTT GAACCACATG TACTCAGCAC 4 74 0 

CTGGACGATT TGTCCaAGTG TTTTTACATG TCACACTACA CGTATGGCAT CCTATGCATT 4 8 00 

SO 

TATCTAAATT TAATACCATC GCAAcTTGCG CTTTAATCTT CAAGCCAATT AACCTCCTTC 4 860 

ATCTTTCTAA CTGCTACATA TAAATCCCTT TGGTTCCCAA TTGGTCCATA ATAATTAAAG 4 920 
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GGCGCGTTGT GTGAACCACC ACGTGTATCT GTAATTTCTG ACCCAGGCGT TTGAATATGT 5040 

TTAT CTTGTG CATGATACAT AAACATTGTA CCTTTAGGCA TACGATGCGA AATAACTGCT 5100 

5 CTTGCCGTTA CAACACCATT ACGGTTATAC ACTTCTAGCC AATCATTATC TTGGATATCG 5160 

TGTTTTTCAG CATCTTCATT TGATATCCAA AC CGTTGGAC CACCTCTAAA TAGTGTCAAC 5220 

ATATGCTTAT TATCTTGATA CATTGAGTGT ATATTCCATT TTCCATGAGG CGTTAAATAA 52 80 

10 

CGGAgTACCA AAGCATCTGT AC GAC CTTTA ATTTTCTTAT CTCTATTCCC AAATAC CATT 534 0 

GGCGGCAATG T CGGTTT AT A TACTGGTAAG CTCTCCCCAA ATTGTTGGAA AACTTCGTGA 54 00 

TCCACATAAT AACTTTGACG TCCTGTTAAT GTTCTAAAAG GTACTAGACG TTCTATATTC 5460 

75 

GTTGTAAATG GTGAATATCG TCGACCTTGT TTATTTGAAC CTGGGAATAC TGCTGTCGGT 5520 

ATTACTTCTC GTGGTTGTGA AGTTATATTT AAAAACGAAA TTTTCTCAGC AGCGCGTTCG 5580 

2Q CTAGAAATAT CTTTTAACGG CATTCCAGTT TGTTCTTCGA GATCTTCATA TGATTTTTGT 564 0 

GATAATTTAC CATTCGTAGC AGATGAAATA CTTAGTATTG CATCAGCTAC ATTACGTGCT 5700 

GTATCAATAC GTGGACGATT CGCTCTCACA GAATCATCAT TTGTATCACT CCACGTACCT 5760 

25 AACATACTTT TTAATTCTTC ATATTGTTCA CTGACACCGA AACTTACACC ATGTGCTCCA 5820 

ACTTTCCCTT TTTCAAGTAC AGGACCAAGC GTGACATATT TGTCGTAAAT TTTAGTGTAG 5880 

TCGCGTTCTA CAATTGCAAA GTTAGGCATT GTACGTCCAG GTACCGCTTC AATTTCACCC 5940 

30 TTCGACCAAT CTTTCACTAC GCCGTATGGT GTTGAAATTT CTTGCTTTGT ATCATGACTA 6000 

AGTGGAGTTG TCACAACATC TTTAAACGTT CCAGGTAAAT AGTCTTTTG C CATTTCTGAA 6060 

AATGCTTTTG CCAACGTTTT ATAAATATCC CAGTCTGAAC GCGATTCCCA TAACGGATCA 6120 

35 

ATGGCAGGAT TGAAAGGATG TACATATGGA TGCATATCCG TTGATGATAA ATCATGTTTT 6180 

TCATACCAAG TCGCTGCCGG CAAAACAATG TCAGAATATA ACGGTGTTGC CGTCATTCTG 6240 

AAGTCTAAAG AGACCACTAA ATCTAACTTA CCTGTTGTTT CTTCACGCCA CGTAATTTCT 6300 

40 

TCT^CTTTT 

TTCATAAAGT ATTCTTGACC TTTTGCAGAA CTTGAAATTA AGTTTGAACG CCATATAAAT 6420 

45 AATGATTTTG GATGATTCTT TTTCAAATCA GGATCTTCTA TTGCAAATTG TGTTTGTTTT 64 80 

GATTTCACTT CATCAATTGC ACGTTGCAAA ATCGCTTCAT TTGAATCTAT ACCTTCATCT 6540 

TTAGCTTCTT CTGCAAACAA CAAACTATTT TTATTAAATT GTGGATATGA TGGTAACCAA 6600 

50 CCAAGTCTAG CTGCTAAAAC ATTATAATCA GCTGG ATGTT GATGCTTTAA CTCCTCTGTT 6660 

TTAGCTAATG GAGATTTTAA ACGATCTACA TTTGACTCTT CATATTTCCA TTGGTCTGTT 6720 
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AATGCGACAG TACTCCATCC 
CAACCGCCAC CATTCACACC 
TAAATCGTAT CTGAGTTAAA 
CCTTCAGTAT CGATAGCGTT 
TTTACG CCTG AAATGGCTTC 
CCTTTTGATT CTAATTTATG 
AAAATTGTAG CAATACGGAC 
GGACGATTGA ATATCCCATC 
TCGTATCCAC CTTCTGTCAT 
AGTTTTAAGT TCCACTTCTT 
ACTAAACTAT CGCTGATTGC 
TGACCTAAGT CACTCGCTCT 
AGCATGATAA GAAACGGCAT 
GGTTGATTAA CATAATGTTC 
TCTGAAC CAG GATTCGGTGC 
GGTGCTACTG AAATGACTTT 
GGAGTACGTG TTAAAGGTAC 
TCACTTGATT CAGGCACATC 
TCTGCATACC AGTCATAAAA 
CCTGCTGCAT AACTAATCAT 
GGACCATATT TTTTTATTGT 
CAATTTGAAC GCACGTGCCC 
TCATTTTCAA CAATAGACGC 
TCAGTCCATA AATCCCAGAG 
TATTCATACC AAGAGAATGA 
TCCGGACCAC AACTTGGATA 
ACAAATACTT TCCAAGAACA 
TTATCGTGGC TCCAACGTTC 
ATCGACCAAT TCCCATTAAA 
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TTCAATCGGA CGACATTTTT 
TTGACAGCCA CATAACATAA 
CCAATGGTTA ATACCCGCAC 
TTGCGCAAAT TCTTTCGCTA 
TTGCCAAGCA GGTGTATATT 
ATCAAAACGA CGCACGCCAT 
TTTGTCACCA TTTGCTAAAG 
TCCATCACTA TCAAAGTATG 
TGATAATGTA GGG TTAATTT 
ACCTTCTTCC CAACGTTGAC 
ATCATGAATA ACTGGCTTCC 
TAAAAATCGA CCCGCTTTAT 
ATCTGTATAT TGTTTAGCGT 
TTGTAAAATA ACATGCGTCA 
TAG C CAGTTA TCTGCAAATT 
TGTACCTTTA TAGCGGACTT 
ATTAGAGCCC CACATAATAA 
TGTTTGCTCT CCCCAAATTT 
ACTAAGCATT TCACCACCAA 
TGACATCGCT GGAATAGGTG 
ATACAGTAAT TGTGCTGCGA 
TCCCATACCT CGGGCTTGCT 
CCATGCAGCA ACGCGATTAC 
TTTTCCACGA ATATATGGAT 
CGCACCTCGT GGACATCCTC 
GTCAGTTTGT TGATTTTCCC 
TGAGCCTGTA CAGTTAACAC 
TCTGTACATT TTTTCCCATT 
TTTTTCTGTT GGCTTAAAGA 



CTTGTCCCAC AT AGTG AG CC 
CTAAGTTTAA GATTGAACGA 
CCATGATAAT CATTGAACGC 
CTTGAATGAC AACACTTTGT 
TTGATTCTGC ATCGTCGTAT 
ATTGACTTGC CATTAAGTCA 
TGACTTGTCG AGTTGGAATT 
GGAATTGAAT TGTTTGTAAT 
TAG AAC CATC TTCTGTTTCT 
CCATTGTGCC ATT AGG TACT 
ATTCGCCTTG CTCTGTTGTT 
ATCCATTTTC ATCTTCATCC 
AATTTATAAA GCGTTCATTA 
TTGCTTGTGC AATTGCAGCA 
TCACATTTTC TGCGTAATCT 
CAGTCATAAA ATGTGCATCC 
TGTATGATGC GTTATACCAG 
GTGGAGAGGC AGGTGGTAAA 
GCAAATTGAT GAATCGAGCA 
TAAATCCTGC GATTCGATCT 
TTATCTCTGT AACGTCTTTC 
TATATTGTTT GGCTTTGTCT 
CATTGTTTTC TTCTAATGCT 
ATTTGATTCG AAGCGGACTG 
TCGGTTCATA TT CAGGCAT A 
AGGTAATCAC ACCATTTTTC 
CATGTGTTGT TCTTACTTCT 
CTCTACTTTT ACTTTCTAGG 
AATTCAATCC AAATTTTCCC 
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TAAAATGCCC AAGACTATTG CTTTAATTAG ATTGTACATT TTTTCACAAA CATAAAATAT 
TAGGGAATCA CCTAATTACT TAAGGAATTT CCCTATCAAT AACGGGATTT CATTGAAATA 
5 ATACACAATC ATGTATGGTC ATG CTTATTG CCAATCTAAA TCGTTCAAAT TTGGCACAAC 

GACAAATAAG GCTTCAACAC GAATATATTC TCTCGGTTGA AACCTTACTT ATTCATTTAT 
TTTTTATAAA TTAGTGACAT AACACTGTAT TAGCATCTGC ACGATCGGTT GAAATATATG 

10 

TTACATTTTC TTGCTGCTTA ATAAATG CAT CATAGTAATC ATATTGCGAC GAATGATATG 
TGCCATTCGA TGTATCATTT GGGTTTAGCA AACAGCCATA ACCTTCGTCA TATAAATGTT 
?5 CACAGAGCAT AAGGGCGTCA TGTTTAGAAC CACTTACTAC ATAAAATTGC TTCATAGGAT 

CATATGATTT AGGAGTGTTT TCAGTATAAT CAACAACTTC CCCTATAATA CATATACCTG 
GTTTCGCCTC AATTGAATAG TGTTGCAATT TTGAAATAAT ATTACTTAAA CGCCCCTTAA 
20 CAACAAACTC GTTAAAACAC GATGCTTGAA AGACAATCGC TATCGGGTAA TCAATATCTG 

TGTATTGTTG TATCTGTGTG ATAATTTTCC CTAAACGTTT TACCCCCATA TAAATTG CTA 
ACGTGCCACC ATTCACTAAG GAATTGACAT CCACTTCATT TTCTTCTGAA TCTTTAAAGT 
GACCTGTAGA AAATGTCACA CTTTTAGCAA CTGTACGCAT TGTCAAACCT GTCTGCATAG 
TAGCAACTGc tGCGCTCGCT GATGTCACCC CTGGTACAAT TTCAAACGCA ATATGATGTT 
CATTTAGTAT GTCGACTTCT TCTTGCACAC GACCAAATAT CGCTGGATCG CCACCTTTAA 
GTCTAACAAC CTTGTTATAT CGACGCGCTG CTTCCACGAT ACAGTCATTT ATTTTTTCTT 
GCTGAATATG TTTTG CATAC GGCTTTTTAC CAACATCGAT AATTTCAGTA GTCAAATTCG 
CATATTGTAA AATTAACGGA TTCACTAATC GAT CAT AT AG AATGACATCC gCTTCACGTA 
TTAAACGCTC AGCCTTTTTC GTCAAATAAT TCGGATTACC TGGACCCGCA CCTATCAAGT 
AAACCTTGCC ATATTCCTCT ACAGACATAT ATATACGTTC CCGTCTGTAA CTTCTACCTC 



25 



3S ~* — ~~ **w%w*#w*,fcw uMiv^iAi^ AHi\aALATCC gCTTCACGTA 9720 

9780 
9840 

40 ATAAACATCT ACACAACCTT CATCAGGTTC TTGAACAATA CCTGTATTTA AATCAATTTT 9900 
TTGATCG^^~ AGCG^C^^ ACAATGGTCC 
TTGTTTGTGT GGACAGATAT TGTGAATCGC ATGAATTTTG CCACTTTCTG TTAAAAACAA 
CCCTACCTCT TTGCCTTTGA CAATAACCTT TTTTCCAATT AGGGGTGTTA ATTCATCTAT 
AGTTGTCACT TTAATTTTTT CTTTTGTTTC CATGTATTAC ACCTTCTCCA CTTCAAAAAT 
TCTACGTGCT TGAGCATTGC TAGTTATTGC TTCCCAAGGT TCAGCTTCGA CTGCTTTTTT 
AGCATCCATA ATGCGTTCAA ATAGTTCATT TTGTCTTTCT GGGTCAAGTA AGACTTCTTT 
TACATTTTCA AATCCAAGTC TTCTTAACCA TGGCGCTGTT CTTTCAGCAT ATATACCTGT 



45 



SO 



9960 
10020 
10080 
10140 
10200 
10260 
10320 
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50 



AGTTGTTAAA 
GAATCCATTT 
TGGGCAGCCT 
TTCTAAACGA 
AACACAGCTT 
GTCTTCCCAT 
ACCTGTCACT 
TTGGTCTGCA 
TTGAATATTC 
ATGTGGATAA 
TTTATTTTTA 
TATTTGCGTT 
TGCGGCAACA 
TTTACCACAT 
ATTTTCCGTA 
TTCATCATCA 
TGATACAAGT 
ACCATCATCG 
TTTTTTATAG 
TACAATTTGA 
TGATCCCTTG 
TTCATATAGT 
TGCATATACA 
ATCTAGACCT 
TAAGTCTGCC 
TAAGATTTCA 
TTTAAG CAT A 
TAACACCGTT 
TCCTCCACCA 



AATTCAGCTT 
TCAACTGAGA 
GATACACCCA 
ATGCCAAGTC 
TTAACTGAGC 
ATATTTGGTA 
TTAACTAGTG 
TCTGTAACAC 
GCATGGTAAC 
ACCATGTTTA 
AAGTTTAAAA 
ACTATTTGAT 
AAGTCATCTC 
GAATTCCCCG 
ATCGCATTTA 
GCCATATCAG 
GTGTAATCTT 
ATATCACCAT 
TTATTATCAA 
CCAGCACTAT 
TATCCGTTCG 
GGTGCAACGA 
TTGCTATCAC 
GATTCTTTGG 
GGAATCTCGC 
GTTGTGTTGG 
TTTCCAGCTT 
ACTTCCATAC 
ATTACAATTG 



TTTCAACTTC 
TAATACCAAA 
TTTTGAATTT 
GTGTCGTGTA 
GTGTTTTCTT 
ATTCTTCTTT 
GCACATGATA 
CCCCACGCAT 
GTTCGTTAGC 
AATAATAGTT 
CATGTCGAAC 
CGCGTGTCAA 
CTAAGGTGTG 

CTATAGTACC 
CAATTGATAG 
CAGTGGATTC 
ATAGTACTGC 
CACTATTAAA 
ACAAGTCACA 
TTTCTTTATT 
GTCCATAAAC 
TTGTTTGCAT 
CTACTTCTGT 
GTCCATCAGC 
CTTGCATTTC 
TACGGTCTAG 
CTTGATCTAA 

cmvf T iTr 



TGTACCACCA 
ATCTTTAACA 
ATGAGGTGTA 
TTG CGTACCA 
ACCATAAGCT 
TTTAACTCCA 
TTTCTTAGCC 
TTGAGGTATA 
AAATCTTGAT 
GATTGCTGGT 
TTCTTTAGAT 
ATCAGTACAA 
CTG CAATATT 
AGCCGTTACT 
TTTATCAACA 
CGATGCCTCT 
ACCTTTTTTC 
ACCAACTACA 
TATTTCAATA 
CCCAGAAACT 
TGTTAAATGA 
TTTGCCGTTA 
CACATCATTG 
GTATGGTCGT 
CAATTTAACA 
AAACTTCATA 
TTGCATTTCC 
TAAACCACGT 
AGTCTTAGCA 



TTACCACCGA 
CCTGATTCAA 
TCGATGTATT 
AATCGACAAA 
GATGcTGAAC 
TACAAACCAA 
ACTTCTCCTA 
ACAGAAAATG 
TCTCTTTCAT 
CGACATTTTG 
GTTTTTAAAC 
CCACATATAC 
TGAGCAATTT 
TCTTCAACTG 
CCATTACAAC 
TCTCCACCTT 
ATCATGTTAT 
TTACCGTCTT 
CCTTTAATTT 
TTTAATGACG 
TCAGCTAATA 
TGTTCTGCAC 
ACAACAATAC 
ATACCTACTG 
CCCTCAACAT 
CCTTGCTTTT 
ATCAACCATT 
GCACACTCTA 
ATGTTCATCA 



TATAGATTTG 
CACAACTTCT 
CAAATGTTTT 
ACTCTTTACC 
GCATACCTAG 
CACGTTGTGA 
GACGAATCAG 
TACCATCATT 
CTTCATGATC 
GACATCCACC 
CTTTCGCTCT 
CAGCAGGTTT 
GCGGTTTACA 
TTGTAAAGCC 
CACAAATTGT 
TAGTAAGCAA 
AAAAGCGTGA 
TTAAAAAGAT 
CTGCATTTTC 
TAAATGTTGT 
CTTTACCTTG 
ATTCACCAAC 
CACGATTAAC 
CCATAACAAC 
CATCTTCTCC 
CTAGATCTGC 
CAGCTAAATG 
AACCTAGTAA 
TTTGTTCAGT 



10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
114 60 
11520 
11580 
11640 
11700 
11760 
11820 
11880 
11940 
12000 
12060 
12120 
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2S 



45 



SO 



GAATGCTTTA GAACCTGTCG CAAAAATCAA TTTATCGTAT GATACTTCAA TACCATTTGC 
AGTAGTAACT GATTGATTTG CTCTATCTAC TTCAATTACA GGATCATTTG TAATTAACTC 
GATACCATGT TCCTCATACC ACTCATATGG ATTCATAATT GTTTCTTCAA CTGTCATTTT 
ATTTTGTAAA ATATTTGAAA GCATGATGCG GTTATAGTTT GGATAAGGTT CTTTACCTAT 



12240 
12300 
12360 
12420 

TACCGTAATA TCATATAAAT CGTTGGCGCG CTCTAATATT TCTTCGATTG TTCGAATGCC 



10 v - i ""- t -" i iv.iii.v«iib 1 1 LUAATCCC 12480 

CGCCATACCG TTACCAATCA TTACTAGTTT TTGCTTTGCC ATAAAATATG CCCCTTTACT 12540 

CCATAATATT TATTTCAAAA AAAGGTATTA ATTTTTCGTT AGTGCTTTTA TATTTTCATT 12600 

75 GGAATCATTA AGCTTTCTAA TCTATCGTTA ATGATTTGCT TTAAAATTGG GTCGAAGTTA 12660 

ATTGAAGGTG TGAAGTGTAT ATCTGTATTA ATAACCATGT CATTCATTTG CTGCTTCACT 12720 

TTGTTAACAA GTCTTCCGTC ATATAAAAAT AATGGTACGA CAATCAATTT TTGATACCGT 12780 
20 TTCGAGATGC TTTCTAAATC ATGTGTAAAA CTAATCTCTC CATATAGCGT TCTCGrATiiT 

- = — - — ^ w w 

GTCGGCTTGC TAATTTGCAA ATTTTGAGCG CATATTTGTA ACTCTTCGTG TGCCTTAGTA 12900 

AACTTTCCAT TAATATTGCC GTGTGCAACA ACCATAACTC CAACTTGTTG TTCGTCACGT 12 960 

GCTAATGCGT CACAAATACG TTGTTCAATT AATCGTCTCA TTAAAGGATG TGTGCCAAGT 13020 

GGCTCGCTTA CTTCTACCTT TATGTCTGGA TACCGTCGTT TCATTTCATG AACGATATTC 13080 

GGTATATCCT TGAGATAATG CATTGCACTA AAGATTAGCA ATGGTACAAT TTTAAAATGG 13140 

TCAACCCCAC TTTGAATCaA CGTCGTCaTT ACCGTCTCTA AATCCtGATG CTCACTTTCt 13200 

AAAAACGCAA TATCATAGTG ATGTATATCA TCTTTTACTA ATTCAGAAAT AAATGCTTCT 13260 

AACGCTTGaT TCTGTCGTCC GTGCCTCATG CCATGTGCAA CAATGATATT CCCATTCACA 13320 

TTTACCAACC CTTTCACACG TATTGTATAC CAAATCATTT TGTTTTTGTG AAAAGAATCA 13 380 
CATTATAATG TAAAATCAGG GAATTCCCTG ATGCCTGTAG TCATGCATAT TCCTTATACA 
TTTTCCCTTT TTGTTAAATC AAAAAAAGCG ACCGATATAT GAATCCCTAC TCAACATTTA 



13440 
13500 



TTTGAGCAAG CATTAATATA TCGGTCGCTT GTAGTGTATA TTATTATCTT AAAATGGTGG 13560 
TTGGCCTAAT ATTGTTTCGT CAAAGCGCTC GGGTATCAAT ACTTTGCGCA TGATCACACC 13620 
TAAATCGCCA TCATCATTTT CATGTTCGCT GTATATTTCA TAACCTCTTT TTTCATAAAT 
TTTAAGTAAC CACGGATGCA ATCTTGCAGA TGTACCTAAA GTAACTGCCG CTGACTTTAA 
CGTATCTCGC AAAAATGCTT CTTCAACATA AGTAAGTAAT TGGCTACCAT AGCCTTTCCC 
TTCATACTCA GGATTTGTCG CAAACCACCA GACAAAAGGA TAACCCGAAA TACTTTTCAC 13860 
ACTTCCCCAA GGATATCTAA CCGTAATCGT AGATATAATT TCATCATCAA TTGTCATGAC 13920 



13680 
13740 
13800 
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CCAATCAATA CCTAGTTCTC TTAGAgGCGT AAATGCTTCA TGCATGAGTT CTTGCAATTT 
TTCTGCATCT T 

(2) INFORMATION FOR SEQ ID NO: 104: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1885 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



<xi> SEQUENCE DESCRIPTION: i 

15 

TAATCCTCAA CTTnGATTAT ATGGCTTGGG 
CATTCATACA GTTCGCATGA CTATCATACA 

2Q GTTACCAATC TCAAGATTAC TTCAATGGGG 

TGCTTATAAC GGTGAAGGTG AGTTTAAAGC 
GCATTCATGT AGAACACGTG CAGAATACAT 

25 GTTGAGTGAT GAAGAGATTG CAGAACTTTT 

TGATGAAGTA GAGAAATATG CGTTAGAACA 
TTGGAAGCTA GTCACGGGAC GTTCAAGGAG 

30 CAGGTTAGTT GAAGCGGGTT ATAAACCTGA 

TACGAATTTA GAAAAATTAA TCGGCAAAAA 
AGAAAAGCCG CAAGGTAAAT TAACACTTGC 

35 

GCAATCTGCT GAAGATGATT TTGACAAACT 
TGAAAGCAAA AGTATTAAAT AAAACTAAAG 
CACaTATTTT TGaACCTCAC AGTATG CAAG 

40 

TAATCATTCC TaAATCAGAT ACAAGTACGA 
CTAAAGAAGA AGGAAAAGTT AGTAAGTTTG 

45 CATTACGTGA TGGAGATACT GAAAGAGAAG 

TTAACGCATC AAGCAAACAA GCACCTGGTA 
ATTCTGGAAC TATTGTAAGT GGTGACTATA 

50 ACACAAATGG TAATAAGGGT ATCGCAGTTG 

GCGAACCTCT TGGCGGTGCA AGTGCAGCAG 

55 



!EQ ID NO: 104 : 

CGCATATGAA CTGCTTAGTT TAGTGTATGA 60 

ACCTCGAATA GATAACTTTT CTACTGAAGA 120 

AACCGATTTT GTTAAACCCT TAGCCAGACT 180 

AGGTAGTCAT TGTAGATTCT GTAAGATAAA 24 0 

GCAAAATGTG CCTCAAAAGC CACCACATTT 3 00 

ATATAAACTG CCTGATATCA AAAAATGGGC 36 0 

AGCGAAAGAG AATGATAAAA CGTATCCAGG 420 

AGTGATAACT GATACAAAAG CAGTCCGAGA 480 

AGATATTACA GAAACCAAGT TACTTAGCAT 54 0 

AGCATTTTCT AAAATTGCAG AAGGCTTTAT 600 

TACCGAGTCT GATAAACGAC CAGCTATAAA 660 

ATAAAAATTA AAAAGGACGG TATATAAACA 720 

TGATTACAGG AAAAGTAAGA GCATCATATG 780 

AAGGGCAAGA AGCAAAGTAT TCAATCAGTT 84 0 

TAAAAGCCAT TGAACAAGCT ATAGAAGCTG 900 

GAGGCAAAGT TCCTGCAAAT CTGAAACTTC 960 

ATGATGTGAA TTATCAAGAC GCTTATTTTA 1020 

TTATTGACCA AAACAAAATT AGATTAACGG 1080 

TTAGAGCTTC AATCAATTTA TTTCCATTCA 114 0 

GATTGAACAA CATTCAACTT GTAGAAAAAG 1200 

AAGATGATTT TGATGAATTA GACACTGATG 1260 
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1380 
1440 
1500 
1560 
1620 
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TTGAGGTGTC AAGAATTTGA AATTTATGAA TATAGATATT GAAACATACA GCAGTAACGA 
TATTTCGAAA TGTGGTGCCT ATAAATACAC AGAAGCTGAA GATTTCGAAA TTTTAATTAT 
AGCTTATTCG ATAGATGGTG GAG CGATT AG TGCGATTGAC ATGACTAAAG TAGATAATGA 
GCCTTTCCAC GCTGATTATG AGACGTTTAA AATTGCTCTA TTTGACCCTG CTGTAAAAAA 
GTATGCATTC AATGCTAATT TCGAAAGAAC TTGTCTTGCT AAACATTTTA ATAAACAGAT 
GCCACCTGAA GAATGGATTT GCACAATGGT TAATTCAATG CGTATTGGCT TACCTGCTTC 1680 
GCTTGATAAA GTTGGAGAAG TTTTAAGACT ACAAAGCCAA AAAGATAAAG CAGGTAAAAA 174 0 

TTTAATTCGT TATTTCTCTA T AC CTTGTAA ACCAACAAAA GTTAATGGAG GAAGAAC r AG 1800 
AAACCTACCT GAACATGATC TTGAAAAAtG GCAACAATTT ATAGATTaCT GTATTCGAGA 1860 
TGTAGAAGTA GAAATGGCGA TTGCT 1885 
20 (2) INFORMATION FOR SEQ ID NO: 105: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2656 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
2B <D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 105: 

TAATCCTTAG TTCACTGnCA AATTTCAAAA CACCAGTTCC CTCTATCTGC ATCCATAGAA 60 

ACTGnATGTT TGTGTCAATA ACCGGATTAT ATTGTGATGn TGTTTGTAAC TCGATTAAGT 12 0 

TAT CATCTTT CGAAAAATTA TCTACTACCA TTATTCAACC ACCTTTCCTT CGAATAAACT 180 

CCATTTACCA ACkCCACCAG TACCAAAGTT TCTAACTAAA AATTGATGTG CAGACGGGAA 240 

GTTATTACGT CTTAATACTT GTGTTGTATT ACCTGGTGTA TTCGATTTTA CTTCTAATAT 300 

CCAACCTGCA ATACCTTTAA AGTCTTTAGG AAAATCAGTA AATCGGTTTG ATTCTTCAGT 360 



AGTGATATAG AAATCTAAAC CAACGATTTT TAAATCTGAT AATTTTGTAA TACTCTTAGG 420 

GATATGTTCC CAATAACCGG CGTTTTGCGG GCAGAAATTC CATGCTCCGT TGTTTTTCTT 480 

45 ATTGAAAATG TCAATGACAC GTTCGAATTT AAGCATATTT CTACCTGTGC TGTTTCTGGt 54 0 

AAGTACTTGT CTTAGAGCAC CATT AT AG TG TCCAGGCAGT ACATCCAAGA ACCACCCTGC 600 

ATCTCTAAAC GCTTTCGGTA ACGGGAAATC TAATGCATTT TGTGTGTCTT Ga CGTATAG A 660 

TATAGTAATG ACCAACTTCC GTAATATCAC TTAGATATGC TGGGTTCTGT ATTGGTAACG 72 0 

GTTTAACACG TCCGCCTGAA TCAGTCATTG ATACTTGAGG TGCGATGTTT TTCAAGAATT 780 
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TAGTTACCCC GATTAGAAGT GCTTTACGTC CTGTTTCTAG ATCGTAATAC ATATCTAGAC 900 

CCTCAGCCTC TTGGAAATCT CCTTTAAAGT TGTTATTCAC AC CG C CT ATA TCGATGCGAC 96 0 

GTTTAAATAA CAATTCTTTC GTTTTGATAT CGAAGCCTTG TAAGTAGTTA GGGTTGGCTG 1020 

TATTCGAAT C ACCTGTATAC CAATATAAGA TACCTGCATC ATAAGTGATA C CTTG CAT AG 10 8 0 

GTTGTGTATC TGAAGTGTAT TCCATAGGTA TATCCATTTG ATACAATACT TTGTCTATAC 114 0 

CTTTATCAAT ATCGTCAGCA CTTCTAACCT CAACAAAGTT CAACGAATTC TTAAGTTGTC 12 0 0 

TTTCAGTGGG TTTATATTCA CGTCTAAAAA TCATTAAATT TTCTACCGGA TTATAAATCG 126 0 

CTGACGTATA TCTGTCGTTA AATATATTCG GCATGACATC TTGCATTTCA TTACCATAAG 13 2 0 

TTATTTCTCC AGTTCTATAT TGGAAACGTA CAAACTTGTT GTTTTTGTTA CTGTCCAATA 1380 

CAGCTGAATA AATCCATAAT TCTCCATCAA TGTATCTATA CGCATTGTGT GTACCGTGAC 144 0 

CGCCGTTTTT AACAAGCAAT CTATCAATAA ATTGTCCGTT GGGCTTCAAT CTAGATAACA 1500 

TGTAATGATT ACCTGGACGA GCTTGCGTCA TATAAATAAT TTTCGTTCTA GGGTCTACCC 156 0 

AAAATGATTG CATTACTGCA TTTGTATATG GCGATAAATC AGTGATAAAT TCCGGT i T CTT 162 0 

25 GCTCTTTTGG TTCGAATCGG TATTCTGTCG CTCGATATTC TTTATAGTGT TCATCTACAG 168 0 

CTTTCTCAAC CTTTTTAGTG AAAACATCTA GTGTTGAATA ATCATGATAC AAACGATCTT 174 0 

GCAATGTCTT ATGACCATAA CCTGTATTAT CAACGCGCGC GTCTTTTAcT TCGTTGATAC 1800 

CGTCGCCGTT ATGACCTAGT ACCATGTTGC TAAATCGACC GTTTAAATAT GTTAAAAAGT 1860 

CAGAGACGTT ACTTGTAACA TTTAAATGTT CATACTTTAT TTGTTCTCCA TCATGTGCGA 192 0 

ATACCTCTTT ATTTCTGTGG TATTCAAGAG AGAAATTAAA ATCCGTCAGC ATGTCTGAAA 198 0 

TAAGTTTAAA GTTATACTCA TTTTCATCTA CATATCTGTA GTCAAAGACT CTACTTAAAT 204 0 

CTGTAATTAG TTTATTACTC ATGTTTTCCT CCTTTACTAT CCATAAAACT GATmATAATT 2100 

TTTAATAAGC TCATACATAA TAACTTCATG ACCTCTTTCA TTAGGATGTA ATCCATCAGG 216 0 

CATGCTAGAT TTTCTAAATG CTGGATTATA TGGTTTGAAA TAATCTGTGT GATAAGCATC 2220 

ATATACTGGT ACATCCAATT CACTACAAGC CAATATCTGA GCATTGACAT AATCCTCTAA 22 80 

AGTTAACCCT AGTTTGTTTT TGTCCGTATC TTTACGGCGT ATCGTTGTAC CACTCATAGG 23 4 0 

GCATTGCCTA GTAGCTGTCA TTACAAGTAT TTTTGAAGCT GGATTATTTT TCCTGATAAC 24 00 

TTCAATTGCA GAACAAAAGG CGCCGTAAAA CGTTTTAGTG TCGGTTTTAT CAGTGCCTAT 24 6 0 

50 CGGTACGCCT GCCCAATAAC CATGTAACCA GTCATCATCT GTACCTTGTA ATATGATTAG 2520 

GTCTCCTCTT ATTTGCTCTG CTTGTCTaTA AATGCTGTTT TCTaCCGCTT CTTTACCTAT 2580 
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CTTGCCTAAC ATTTCT 

2656 

(2) INFORMATION FOR SEQ ID NO: 106: 

5 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4854 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNE SS : double 

(D) TOPOLOGY: linear 

10 





(xi) SEQUENCE DESCRIPTION: 


SEQ ID NO: 


106: 






15 


AAAATGAGGG TTCTAGCGGA AATTACCAAA 


AGCGTGGTTC 


ATACTATGGG 


CAGCGTAATC 


60 




GTATTTCAAA AGAAAAAACA CCTAAATGGT 


TAGaAAATAG 


AGATAAACCT 


AGTGAAGAAG 


120 




ATTCGGCTAA AGATAATAGC GTAGATGATC 


AACAATTAGA 


GCAAGATCGA 


CAAGCATTTC 


180 


20 


TAGATAAATT ATCTAAAAAA TGGGAGGAGG 


ACAGTCAATA 


ATGAAGCAAT 


T'T' aji^^Q TAT 


24 0 




AATTAACACG TCGCAGGACT TTGAAAAAAG 


AATAGAAAAG 


ATAAAnCAGA AGTAATCAAT 


300 




GACCCAGATG TTAAGCAATT TTTGGAAGCG 


CATCGAGCTG 


AATTmACGAA 


TGCTATGATT 


360 


25 


GATGAAGACT TAAATGTGTT ACAAGAGTAT 


AAAGATCAAC 


AAAAACATtA 


TGACGGTCAT 


420 




AAATTTGCTG ATTGTCCAAA TTTCGTAAAG 


GGGCATGTGC 


CTGAGTTATA 


TGTTGATAAT 


480 


30 


AACCGAATTA AAATACGCTA TTTACAATGC 


CCATGTAAAA 


TCAAGTACGA 


CGAAGAACGC 


540 


TTTGAAGCTG AGCTAATTAC ATCTCATCAT 


ATGCAACGAG 


ATACTTTAAA 


TGCCAAATTG 


600 




AAAGATATTT ATATGAATCA TCGAGACCGT 


CTTGATGTAG 


CTATGGCAGC 


AGATGATATT 


660 


35 


TGTACAGCAA TAACTAATGG GGAACAAGTG 


AAAGGCCTTT 


ACCTTTATGG 


TCCATTTGGG 


720 




ACAGGTAAAT CTTTTATTCT AGGTGCAATT 


GCGAATCAGC 


TCAAATCTAA 


GAAGGTACGT 


780 




TCGACAATTA TTTATTTACC GGAATTTATT 


AGAACATTAA 


AAGGTGGCTT 


TAAAGATGGT 


840 


40 


TCTTTTGAAA AGAAATTACA TCGCGTAAGA 


GAAGCAAACA 


TTTTAATGCT 


TGATGATATT 


900 




GGGGCTGAAG AAGTGACTCC ATGGGTGAGA 


GATGAGGTAA 


TTGGACCTTT 


GCTACATTAT 


960 




CGAATGGTTC ATGAATTACC AACATTCTTT 


AGTT CTAATT 


TTGACTATAG 


TGAATTGGAA 


1020 


45 


CATCATTTAG CGATGACTCG TGATGGTGAA 


GAGAAGACTA 


AAGCAGCACG TATTATTGAA 


1080 




CGTGTCAAAT CTTTGTCAAC ACCATACTTT 


TTATCAGGAG 


AAAATTTCAG 


AAACAATTGA 


1140 




ATTTTAAAAT GATTGGTGTA TAATGAATAC 


AAATCTAAAT 


CGTTTAAATG 


ATTGAAGACA 


. 1200 


50 


AGATGATCTA ATCAATATTA CACAGAAAGC 


CATTGTTTGA 


TGAGAATATG 


GTTAATAAAT 


1260 




TAGATGATTA CTACTTCATT TATGGTATTT 


GTAATGAATA 


CCCGGATCAA 


GACCGTTATC 


1320 
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CTCGTCCCTT GTATAGGGGC GGGATTTTTT GTTTTTTTCA GACATAAATG TTTGTTGGTG 1440 

TCATAAATTC CCTGTTTATT GTTAATAGGT TTAATGTTAA AACGATGATT GTTGTTCAAT 1500 

TTTTTAACGA GGTCAGATAA AAGTATTTAT AAAGCAAATA GGAGGGTTTA ACATGGAACA 1560 

AATTAATATT CAATTTCCAG ATGGTAATAA AAAGGCGTTT GATAAAGGTA CTACTACTGA 1620 

AG AT AT AG CA CAATCAATTA GTCCTGGATT ACGTAAAAAA GCTGTTGCCG GCAAATTTAA 1680 

CGGGCAACTT GTAGATTTAA CTAAACCGCT TGAAACTGAT GGATCAATTG AAATTGTGAC 174 0 

ACCAGGTAGT GAAGAagcGT TAGAGGTATT ACGTCATTCT ACTG CACATT TAATGGCACA 180 0 

CGCGATTAAA AGGTTATATG GTAATGTTAA ATTTGGTGTA GGTCCTGTAA TAGAAGGTGG 1860 

ATTCTACTAT GACTTCGACA TTGACCAAAA CATCTCATCT GATGACTTTG AACAAATTGA 1920 

AAAAACAATG AAACAAATCG TTAACGAAAA TATGAAAATC GAACGAAAAG TGGTTTCACG 1980 

20 AGATGAAGTG AAAGAGTTAT TCAGCAATGA TGAATACAAA TTAGAATTAA TCGACGCGAT 204 0 

TCCTGAAGAT GAAAATGTAA CATTATATAG TCAAGGTGAT TTTACTGATT TATGTCGTGG 2100 

AGTTCACGTT CCATCAACAG CTAAAATTAA AGAGTTTAAA CTATTATCTA - CAGCAGGTGC 2160 

ATACTGGCGT GGAGATAGTA ACAACAAAAT GTTACAACGT ATATACGGTA CTGCTTTCTT 2220 

TGATAAAAAA GAATTGAAAG CACATTTACA AATGTTAGAA GAGCGTAAAG AACGTGATCA 22 80 

TCGTAAAATT GGTAAAGAGT TAGAACTATT CACAAATAGC CAATTAGTTG GTGCTGGTTT 234 0 

GCCATTATGG TTACCTAACG GTGCAACAAT TAGACGTGAA ATTGAACGTT ACATTGTTGA 24 00 

TAAAGAAGTT AGCATGGGAT ATGACCACGT TTATACACCA GTACTTGCTA ATGTTGATTT 24 60 

ATACAAAACA TCTGGT CACT GGGATCACTA TCAAGAAGAT ATGTTCCCAC CAATGCAGTT 2520 

AGATGAAACT GAATCTATGG TATTACGTCC AATGAACTGT C CACATCAT A TGATGATTTA 2580 

TGCGAATAAA CCACATTCAT ATCGTGAATT ACCTATCCGT ATCGCTGAGC TAGGAACGAT 264 0 

GCATAGATAT GAAGCAAGTG GTGCTGTATC AGGATTACAA CGTGTTCGTG GTATGACTTT 2700 

AAATGATTCA CATATCTTTG TTCGACCTGA TCAAATTAAA GAAGAATTCA AACGCGTTGT 2760 

AAACATGATT ATTGATGTGT ATAAAGACTT TGGTTTCGAG GATTATAGCT TTAGATTAAG 2820 

45 TTATAGAGAC CCTGAAGATA AAGAAAAGTA CTTTGATGAT GATGATATGT GGAATAAAGC 2880 

TGAAAATATG CTTAAAGAGG CAGCGGATGA GCTTGGCTTA TCGTACGAnG AAgCGATTGG 294 0 

TGAAgCGGCA TTCTATGGTC CGAAACTAGA TGTTCAAGTT AAAACAGCGA TGGGTAAAGA 3000 

50 AGAGACATTA TCAACAGCAC AACTTGATTT CTTATTACCA GAACGTTTTG ATTTAACTTA 3060 

TATTGGTCAA GATGGTGAAC ATCATCGTCC AGTTGTTATT CATCGTGGTG TTGTATCAAC 3120 
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AGCGCCAAAA CAAGTTCAAA TCATTCCAGT TAACGTTGAT TTACATTATG ATTATGCGCG 
CCAATTACAA GATGAATTGA AATCTCAAGG CGTTCGTGTA AGTATTGATG AC CGTAATGA 
AAAAATGGGT TATAAAATCA GAGAAGCTCA AATGCAAAAA ATACCTTATC AAATCGTAGT 
TGGGGATAAG GAAGTTGAAA ATAATCAAGT GAATGTGCGT CAATATGGAT CGCAAGACCA 
AGAAACAGTT GAAAAAGATG AATTTATCTG GAATCTAGTT GATGAAATTC GTTTGAAAAA 
ACATAGATAG ACAGTTGTCG CAATAAAATG CTTTAAAACT TTTATTGCGT ATCAAGTTTT 
ACAGGGTTGA TTATGCGTGA TGAATC CTGT ATATTACAAG TTAGTTAAAA TATTAAATTg' 



3240 
3300 
3360 
3420 



3720 
378 0 
3840 
3900 
3960 
4020 
4080 
4140 



1Q "~ * A «*v- A ^ wwiiLi^u baibAAAne GTTTGAAAAA 3480 

3540 
3600 

,5 AGTTAGAGGT TGCATGTTTA ATT AG T AACT TGTCAGAAGT ATTTATGGTA CATAAGTTGA 3660 

ACAAGTGAAA GGTAAAGATG CCGAAATAGA TATAAAC CAT AAATTATATC TATTGGGACA 
GTTTTCGAAT AGGAACTG T A CTGTCACAGA ATGTGATGTG CT AC CTT ATA TAGATAATTG 
20 CCAAAGTGGT TGCATATCTT AAAGGTATGT AGCCACTTTT TTACTTTTAA TATCACTATG 

TTCTGTAAAA AAGGGTATGA AAGTGAATAA AGGTTATTTA TTTCTTGGCC TCTAAAACAT 
GGAAAGGGAG CTTATATGTC AAAAGTTCAA AATGAAAGTA ACAATGTTGT CAAAAGGGGA 
CTTAAAGATC GTCATATTTC TATGATTGCG ATTGGGGGTT GTATTGGTAC AGGTTTATTT 
GTAACTTCTG GTGGAGCAAT TCATGATGCA GGTGCTTTGG GTGCATTAAT AGGATACGCA 
ATTATCGGAA TAATGGTATT TTTCTTAATG ACGTCACTTG GCGAAATGGC TACGTATTTG 
CCAGTATCAG GTTCATTTAG TACATATGCT ACAAGATTTG TTGATCCATC TTTAGGGTTT 4200 
GCGCTTGGTT GGAACTATTG GTTTAACTGG GTAGTGACTG TAGCAGCAGA TATTACGATT 4260 
GCAGCACAAG TCATTCAATA TTGGACACCA TTGCAAGGCA TACCCGCTTG GGCATGGAGT 
GCGTTGTTCT TAGTTATAAT TTTTAGTCTG AATTCGTTAT CAGTTCGCGT CTATGGTGAA 
AG TG~AAT ACT GGTTGGCATT GATAAAAGTG GTTACAGTTA TTGTTTTCAT TGCAATTGGT 
TTATTAACGA TTGTCGGAAT CATGGGTGGT CATGTTGTAG GATTCGAAAT ATTTAATAAA 4500 
GGTGAAGGTC CAATTCTTCG ~TGGCAACTTA~ G^TOA^TT TCTTATCAAT r TCTCAGGTOTA 4560 
TTCTTAATCG CTGGTTTCTC ATTCCAAGGT ACTGAGTTAA TTGGTATTAC GGCTGGTGAA 4620 
4S TCAGAAAATC CTGAACGTGC TGTGCCGAAA GCAATTAAAC AAGTATTCTG GAGAATTTTA 4680 

TTATTTTACA TTTTAGCCAT TTTTGTTATC GGTATGTTAA TTCCTTATGA TAGTAGTGCA 4740 
TTAATGGGGG GTAGTGATAA TGTAGCAACG TCTCCATTCA CATTAGTGTT TAAAAATGCT 4800 
GGATTTGCGT TTGCAGCATC ATTTATGAAT GCAGTCATTT TAACGTCTGT GTTA 4854 
(2) INFORMATION FOR SEQ ID NO: 107: 



4320 
4380 
4440 



55 



622 

JNSOOCID: <EP 07865 19A2_I_> 



EP0 786 519 A2 



(A) LENGTH: 2488 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TO ECOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 107: 



10 


ATCAAAAATT 


GATTGTTTTC 


nATTTTTTGT 


TTCAGCGCGG 


GATCTTTTAC 


GTCTTTTGTG 


60 




AAAACGaTTT 


TATTATTAAC 


TACTITTACT 


GGATAACTTT 


TG TATGTCG A 


GTCAGTAGCA 


120 




TTTTTTCTAT 


CGTTTGTAGT 


TGTGTCATAT 


TCACCAgTTA 


TTTTATGTGT 


GTTCTTATCT 


180 


IS 


ACCTTTAACA 


ACATACGGTC 


TTCTTTTAAA 


AGCTCATCTG 


ATCCAACAAC 


TGAATAAGAG 


24 0 




GATTCTATAT 


ACCATGTGTC 


TTGATCATTA 


TTTTCATAAT 


GGGGATTATC 


GTGACCATCA 


300 




ATTTCATAAA 


GCGTTTCTAA 


gtttttaata 


GGATACGTAC 


TTAGTACTTT 


TTTAAGACCA 


360 


20 


TCTTTCAAAT 


GAATTTGTTC 


CCACTTCATT 


GCCAAAAACA 


TATCGCCACT 


GACTACAATT 


420 




GAAATAATAA 


TAATTGCTGC 


TAAGTTTAAC 


CAGAAAATTT 


TATGTGCTTT 


CATACATTCC 


480 


25 


CACCGTTTCT 


CAAAATACTT 


CATTAACACT 


ATAATAATAT 


ATTTTGAAAA 


ATATTTACAT 


540 


CAGTATTAAA 


GTGAATATCA 


AATTTTAAAT 


TTATGAAAAT 


AATAGATATT 


TATAAAAAGC 


600 




GGAAAAGAGA 


TACAATAAAA 


AACTGCATGA 


CGTTTGAGAC 


GTCACACAGT 


GTAACTAAAA 


660 


30 


ATTTAAAAAG 


TTGTTGCTAA 


TTTTTCAGCA 


TTATTAATAC 


TAGTTGCTTT 


AATTTCTTCA 


720 




GTCTTATGAG 


GTTCAG CATT 


GTGTCCTTCA 


ATAATGATTG 


TTTCATATGA 


TGGCACACCT 


780 




AAGAATGTCA 


TAATTGTTCT 


TAAATAACGG 


TCACCCATTT 


CAAAATCAGC 


AGCAGGTCCT 


840 


35 


TCAGTATAAT 


ATCCACCACG 


TGATTGAATG 


TGTAATACTT 


TTTTGTCAGT 


TAGTAAACCT 


900 




TGTGGTCCTT 


CAGCAGAATA 


TTTAAAAGTT 


TTACCTGCAA 


TTGAAATAGC 


ATCAATATAT 


960 




GCTTTAACTA 


CAGGTGGGAA 


A Ci A A A fZTZTTH 
rtUnnnw 111* 




'IT A r* Ik A KT&^ 


ATATTTATCT 


1020 


40 


GCACTTAAAA ATTCTTCTAA 


AATGTCACTC 


AATCTTGAAA 


CTTTCATTTG 


TTCATCATCA 


1080 




GTTAACGTTT 


CGCCATTACT 


CATTTTTCCC 


CAACCAGTTA 


ATACATCTTT 


GTCAATAACT 


1140 




GGAATATAAG 


TTTCArATAA 


ATCAATATGT 


TTCACTTCAT 


CATCAGGATG 


TTGTTGTTGA 


1200 


45 


TATGTTTCGA 


TAAATGCTTT 


ACCAGCCGCC 


ATAGAATTTG 


ATACCAGTTC 


ATTAAAAGGG 


1260 




TGTGCTGTAA 


TATATAATAC 


TTTTGCCATT 


TGAAAATTCT 


CCTCTGkTTC 


TGTTATTTTC 


1320 


SO 


TTAAGTATAA 


TTATTATACT 


CGATATAAAA 


TTTAATATCA 


ATCAAAATAT 


TCAAATTACC 


1380 


ATCATTTTCT 


TCATCTATAT 


nTGGCAGTAC 


TACTAAAGTA 


TGAGTGCATT 


TAATTATGAa 


1440 




ATAGTTGATT 


TaGAATAtAT 


ACTTAATACC 


CAAAATATAT 


GAAGGATGGA 


TGCCACTATG 


1500 
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ATTATTTATA TAGATGACAT TCAAAAATGG TTTAACCAAT ATACCGATAA ATTGACACAA~ 
AATCATAAAG GACAAGGACA CTCAAAATGG GAAGACTTTT TTAGAGGGAG TCGGATTACT 
GAGACTTTTG GTAAATATCA ACATTCACCA TTTGATGGTA AGCATTATGG CATTGATTTT 
GCATTGCCAA AAGGTACACC AATTAAAGCG CCGACGAATG GTAAAGTAAC ACGTATCTTT 
w AATAATGAAT TGGGCGGCAA GGTATTACAG ATTGCCGAAG ACAATGGAGA ATATCACCAG 
TGGTATCTAC ACTTAGACAA ATATAATGTC AAAGTAGGTG ATCGAGTCAA AGCAGGTGAT 
ATTATTGCAT ATTCAGGCAA TACAGGTATA CAAACGACAG GCGCACATTT ACATTTTCAA 
, s AGAATGAAGG GTGGCGTAGG TAATGCATAT GCAGAAGATC CAAAACCGTT TATCGATCAG 
TTACCTGATG GGGAACGTAG CCTATATGAT TTGTAGTTAT AGAAGGGTGC CCGCAGTCTA 
AAAAATTAAG CAATCATTGT GTGAGTATGA TACTTACATA ATGGTTGCTT TTTTCAATGA 
AAATCGTAAT GCTAAGTCAT ACTTGTTTGA TTTAGATATT ACTTAAAATG TAAGACAAGG 
TTGTTAGCAT TGGCAGTGAA ATATCGCACA TAAAAAACAT TATTGTCACA CTAGAAAATA 
GTTGTGCACT ATATCAATTT TCTGTATAAA AGTTTAATTC TGACAGTAAT GTAAACGTTT 
ACAATTTATG ATTGACATTA ATAATGACTG AATATATGAT TTATGTAAGT ATTTGTGCAA 
CGTTTTCACA AAGTGTATTG CACaAyCAAA CTGC AAACaA aGTATGGGGg GCCATAACAT 
30 GG CAGAACTA AGTT AG AG Cn TATTAAAA 

(2) INFORMATION FOR SEQ ID NO: X08 : 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4093 base pairs 
35 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 



40 



SO 



(xi ). SEQUENCE -DESCRIPTION :-SEQ-ID- NO : - 108 : — 

TTTTCTTTAT TTCAAmCTGT ATATTaATGA TGTCACTTCA TTTGATACGA TTCTTGATAA 
CCTATTCAAA ATTCCGCCAA ATAACATAAA TATTATATAA ATGCCGATAC TTTTAATCAT 



55 



TTTCTACTTT TTCTTCGATA CGGAAACTTG TTTTCGAATT GAACACTTCA CCAGCTTTTA 
AAATTGACGG TGCTTTTTCA CCATATAAAT TAATATCATT TGGTAAAAAT TGTGTTTCTA 
ATGTAAAGCC AGAATGTGGT TTATAAATAT TAAATGGACT ATCCCACTCA TCAGGCTGGT 
TAAAAGTAAA GAACACAACA TGAGGCATAT CTGTATCGAC CTCTAACATA AATTCATGAT 
TTTCAACATA CATTTTATGT TCACCAACTG TAAATGGGTG ATCGAGACCA CCAAAACGTG 



60 



180 
240 
300 
360 
420 
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TATCTTCAAA 


CACTTCATGT 


AAATCTAGAA 


TATCACCTGT 


AACAATATTT 


CGCTCATCTA 


540 




ATACATACAT 


ATCTAATTGA 


TTACTTGAAA 


TGCGATGATT 


ATCAACGACA 


TTATTATCTC 


600 


c 
o 


GATTCAAATT 


GAAGTACACA 


TGATTCGTAG 


GACTAAACAA 


TGTGTCTTCT 


GATGCAACTG 


660 




CTTCGTATTC 


AATCGACCAT 


TGGTGATCCG 


CATCATAAAT 


ATGTGTAATC 


GTCACATCGA 


720 


10 


TATCACCCGG 


GAAATGATCA 


TCAGCTGATT 


TCAACACCGT 


CTTAAATATA 


ACTTTAATTT 


780 




GAGCAATTTC 


ATTTCTAATT 


TCATAATCAA 


ATAACTTATT 


GTCCAAACCA 


TGACATCCAC 


840 




CATGTAAATG 


ATGTTCACCG 


TTGTTTTTTT 


CTAACTGATA 


TTCTTTACCT 


TTCAACTTAA 


900 


15 


ATTTAGCATT 


ATCAATTCTA 


CCGCTATATC 


TTC CTATAGA 


AGCACCAAAT 


TTAAAAGGAT 


960 




TACTATGATa 


AAATTCATCC 


GCTTCAACAA 


CATTTCCAAG 


AACAATATTA 


TTATCATGAT 


1020 




ATTTCCAAGA 


CACTACTCTT 


GCTCCATAAT 


TCGTAAAAAT 


AATTTTAGTT 


TCATCATTAT 


1080 


20 


CAATTTTGAT 


TAAATCTACA 


CCTTGTCTTT 


GGTGCTCAAC 


TTCAACTATC 


AITUTTACTT 


1140 




CTCCCTTCTA 


ACCACAAGTG 


TTCAAGCTCT 


GCTGGGTAGC 


AACATTACTA 


AAACACCTAC 


1200 


25 


AATACAAATG 


ATTGCACCGA 


TAACATCATA 


TTTATCTGGC 


ATTTGTTJAT 


CTACGACCAT 


1260 


CGCAAAAATC 


AAACTCATGA 


TGATAAATAC 


GCCACCATAT 


GCTGCATATA 


CTCTTCCGAA 


1320 




TGATGGAAAT 


GATTGAAATG 


TCGCAATGAC 


ACCATATAAC 


ATGAGTATCG 


CACCGCCTAT 


1380 


30 


TAGCCCAACA 


AGTGAAGACT 


GTCCTTCCCT 


AAGCCACAGC 


CAAATCAGGT 


ATCCCCCACC 


1440 




TATTTCACAT 


AAGCCAGCTA 


ATATAAATAT 


AAAAATCGGA 


TATAACATGA 


AATCACTCCA 


1500 




TCACACATTT 


GCTATCAATA 


ATCTATCGGC 


TACATATCAT 


TTGTTTACAT 


TTCTTCTTAC 


1560 


35 


TTCACATTCC 


CATTTTAAAA 


AGTTCGTTTT 


CACATTCATA 


TTGTACACTT 


TTTTAGACAT 


1620 




TATTCTATAG 


CTAAATATAA 


AAAAATAAGA 


GTAACACGCT 


TTCATCATCA 


TTTTATATGA 


1680 


40 


TAAATGTGTG 


TCACTCTCAT 


CAATTTTATT 


TTTTAAATAC 


ACGTTTCATT 


GAATTAAATA 


1740 


AGCCACGTTC 


AAATGTAAGT 


ACTGAATCTT 


TATATGTTTT 


AATTGCAATC 


CATATCAAGA 


1800 




CAGCTACCAT 


TACAATTGAG 


ATTAAAGAAC 


TTAAGATGAC 


CTCATATATT 


TGAAGCCCTG 


1860 


45 


AAGTTTGAGC 


GCGTACAACT 


AATTGAAATG 


GCGCTAAAAA 


CGGAATATAA 


CTTGTGATTA 


1920 




AAGCAAGTTG 


TCCATCAGGA 


TTATTTATCG 


TGAATATCGC 


GATATAAAAT 


GCAATCATAC 


1980 




CAAGTAATGT 


CAGTGGCATC 


AAAGATTGAT 


TTAAATCTTC 


TATTCTAGAT 


GTTAATGATC 


2040 


SO 


CGAGGATGGC 


TGCAAGTAAT 


ACATACGCCG 


TAATTCCAAC 


AATACTACTT 


ATAATTCCGA 


2100 




CAATAATAAT 


TTGCCAAGAC 


AATTGATTCA 


TTTCCACGTT 


AAAACCTTGT 


AGCAAGTCTT 


2160 




TTAAGTCAAA 


GGCAAAAATG 


CATATAACTG 


CCATCAATAC 


AATTAAAATA 


ATCTGAGTCA 


2220 
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TAATAATCAT TTCAATGACA CGCGATGTTT TCTCACTAGC AATTTCCATA GCTATTTGAg" 2 34C 

ATGCATAATT TAAAACAATG AAGAACATTA GAAAGATAAT GCCATmaGcT AAAGCATAGT 2 40C 

5 TGAAAATCTT TTGTCCTTCT GATACTTTAT GGACTTCATC ATTAGAAATC ACCTTATTAT 24 6C 

CAACTTTACT TTGTGCTTGT AATTTTTGTA AGTCTTCTTT GTTGATATTT AATTCCCCGG 252C 

w CTACCATATT TGTTTGAATA GCTGTAAGCA GTGCTTGTAC TTTTTGTGAA TCTTCATGAC 2580 

TTACTCGCTT CTCACTAATG ATTGTCCCTT GTAACGTGCG ATTTTGATTC ACCTTGATAA 2640 

TATAAGCTTT ATCAAGTTTA TGTTTTTTTA CTTCTTTTTC AGCATCTTCT AT AG AAA CTT 2700 

is TAGTAAACTT AGCATCACTA TGAAATGTAT TCGCCTGTTG CTTGAAAACC TTATAGATTT 2760 

GTTCATTCGG TGCTGCTACA CCAATTTTAT CTGGACCATC ATCAAACATG TTAATAATCT 2820 

TATCAATGTT AGATAGGCCA ATCATTAAGG CAGCAATAAT AATCATAAAA ATTACAAATG 2880 

20 ATTTAGCTTT AATTTTTTTG ATATATGTCA AAGTAAATGT CGCCCAAAAC TTATGCATCC 2940 

TTGCCACCAA CCTTCTCAAT GAATATATCT TGTAATGATG GTTCTACAAC TTGGAATCGT 3000 

TTAACATAAC CTTGATGTGC CACAACTTGA TAAATATCTT TGGCTACGTC TTCATTCTCA 3 060 

2S 

ATCGTCAACT GAAGACCTTG CTTCATGTTT TCACTATGAA TGATGCCTCT AATGTTTGTT 3120 

AAATCTGGTA GTGTTGTTTC TGATTCAATG ACAACTTTCT TGTTACCATT AGATGCACGT 3180 

30 ACATGATTGA TATCACCAGA AACAACAAGT TGACCTTTAT CTAAAATACA AACATCATCA 3240 

CATAATTCTT CAACATGCTC CATACGGTGA GAACTATAAA CGATTGTACT GCCCCAATCA 33 00 

TTTAAGTCTT TAACTGCTTc TTTTAATAAC TCAACATTAA CTGGGTCTAG ACCACTGAAA 3360 

35 GGCTCATCTA ATATTAGTAA TTCTGGTTTA TGTAACATAC TTGCTAACAG CTGAATTTTT 3420 

TGTTGATTCC CTTTTGATAG ACTATCAATT CGTTTTTTGC GGTTTTCAGT AATATCAAAA 34 80 

CGCTCAAGCC AATACGATAT TTGCTGTTGT ATTTCTGTTT TTGACATTCC CTTTAAAGTT 3 540 

40 

GCCAAATATT TCAATTCTTC TTCAACTGTC AATTTCCCAT GTAAACCGCG TTCTTCCGGT 3600 

AAATAACCAA TACGATTGTA CATTGTTTTA TCTAGTTTTT TACCGTTATA CGTrrTGTGT 3660 

4S CCTTCAGTTG GTTCACTTAA GCCTAAAATC ATACGAAATG TCGTTGTTTT ACmTGCACCA 3720 

TTTCTTCCTA GAAAACCTAA CATTTTACCT GATT CTAACT TTAATGAAAT ATCATTTACT 3780 

GCCGTCATCT TGCCAAAACG TTTCGTAACA TGTTCAATTA CAAGTCCCAT ACTTTGCCTC 3 840 

so CTAAAAAnAT ATGTATTTAT CTTAATATAA CATTTCCATT CTCTATAAAT GCAATATTTT 3 900 

TAAAATGAAT TTATTTTTAA AATTTCTGAA ATTGAAAAAT TTAAATAGTG CCATTTTTGC 3 960 

ATGTTAAGTA TCATTAGCAC TAGATATGTT TTTTCCATGC CTTTATTGCC TTATTTGTAA 4 020 
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CTTnC CGGTG TTT 

(2) INFORMATION FOR SEQ ID NO: 109: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 17846 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

w 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 109: 



15 



20 



25 



30 



45 



SO 



TGCCAAACTA 


CCTTTTGACA 


GTCGTTGCTG 


TACTTCAGGA 


TGATCAATCA 


CATATnTTAC 


60 


TTTATCAAAT 


AGGGCATCTT 


CATCATTTTT 


AGTAATTAAA 


TAACCATTGA 


AATCTGAAGT 


120 


AATCAGTTCG 


TTAGGTC CAT 


ATTTAATATC 


ATAACTAATA 


ACTGGAACAC 


CATGTGCTAA 


180 


AGATTCAAGT 


AGCGCTAAAG 


AGAAACCTTC 


CATGTTACTT 


GTTATTAAAC 


TCAAATAGGC 


240 


ATCGCTATAT 


TCTTGGTCTA 


GATTGCTTAA 


AAAGCCGCGT 


AAGTAAACAT 


GATTTTCCAA 


300 


TC CAT ATTTT 


TGTATCAATT 


CATTTAATTT 


TTTACTTTCA 


GAaCCAAAAC 


CATACATATG 


360 


AaGCTCTATT 


TTTGGGACAT 


ACGATACTAA 


G CGTTTAATT 


AATTCAATTT 


GTTGATGTAA 


420 


TTGTTTTTCA 


GGTGAATAAC 


GAGCAACGGA 


AATTAATTTA 


ACACTGCGCT 


GATCTAATGT 


480 


TTGGACTGGT 


GTATCAATTG 


TTTCACTATA 


GCCGACAGGA 


ATATTAACAA 


CTGGAATAGT 


540 


ATGGTTAATA 


CGTTTTTCAA 


CATCTAATTT 


TTGCTGCTCA 


GTAGAAACGA 


TAATTGCACG 


600 


ATATCGAGAT 


AAATTTTCAA 


ACATCGCTTT 


ATATACATTT 


TTAAATGGCG 


ATGAATCTAA 


660 


TGCATCAATA 


tttttaatgt 


GTGTACTGTG 


AAGCACAGCT 


ACTACTGGGA 


TTGACTCAGG 


720 


CGTTAAGTTG 


AAAATAGGTG 


CTGTGTACAC 


ATTACGATCA 


CTGAAAAATA 


AATCCCCATG 


780 


TTGATATAGT 


ixrrrrAATGA 


AAAATGCGCC 


TAATTCCGTT 


TCATTATTAA 


AGAAATATTG 


840 


TTTGTTAGCA 


TAGTAAACAA 


TAATTTTTTG 


TACTTCTGGT 


TTGCCATCCT 


TGTAAGAAAA 


900 


ATACTTTTCT 


AATTTTGTGT 


CACCTTCTGG 


ATTATAGAAA 


AATTCACATA 


ATGTTTGTTG 


960 


TTTATCAACA 


AGAATCCTAC 


TACAACTTAA 


AAAG CCACGC 


ACATCATAAA 


AATCACGTTT 


1020 


TACTTtTCGT 


CTTTGACTAT 


CAAAATGATT 


TACATAATCT 


AATATACGAT 


ATTTAGGATC 


1080 


TTGAAAATGG 


GCATACATTA 


AGAAACGCTC 


TTGATCATAT 


ATTCTAAAGT 


CATGACTATT 


1140 


TTCAACATGT 


TTTAAAGTAT 


AATGACATTC 


ATCAGTCCAA 


TACGACAACC 


AGTCAAATGG 


1200 


TTCATTGCGT 


TCTAAATATG 


TTGCTTCTTG 


GAAGAAATCA 


TACATATTAA 


TATAGTCAGA 


1260 


ACTAGTAATA 


TAATTTTGGG 


CATTTCTATA 


TAAATATCTA 


TTCCATGACA 


GAAATACACA 


1320 
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CCCAGTTAAA TTAACACCTA AACTATTACC TACAAAATAA TTCATTTACA ACACCACTTA 
TATCTATTTT TTATAATTAT ATCACATAAT ATTTAATTAC TTCTTTTAAC TGGAAGATGT 
GTTTATTTAT AAAACAACAA ATTTTGATAT TTATAATGAT AGTAGTTATT CAATCAcTAC 
GACCcAATAT ATCATkGTAG AGCTTAGGAT ATTGATTTAT GACTCAGGCA CATCAAATGa 
GAgGATTTAT AAArGAGATA TACAACTCTA GAAGGTATAA TAAAAACGCG CAACTAATGT 

TACGCGTTTG AATTAATCAT ATGATATTAT TTGCGATACT TTAATTT AG C GAAAgcATCA 17 40 

TGTTGATGGA TAGACTCTTC ATTACGACAT TCGATATCGA AAC CGTCTAA CCAATCAAAT 1800 

TCAACTAAGT CCGCGGCAAT TAAACGAATT AAGTCTTCGA CAAAACGTGG ATTTTCATAT i860 

GCACGCTCTG TCACACGTTT TTCATCAGGA CGTTTTAAAA TAGGGTATAG AATTGAACTT 1920 

GCATTAGCTT CCATTGCATC TAAAATTTTA TTTTTATAGT CATCAACTAT GTCTTGATCT 1980 

TTATTAATAT ATGTTTTAAC AGTGACAACA CCACGTTGGT TGTGCGCTGA ATACTCACTT 204 0 

ATTTCTTTTG AACAAGGGCA TAGCGTTGTG ACAGTTGCTT CAATAGTAAG TTCTTTACGT 2100 

GTAnCTTTAT CACCGTCAAT TGCTAATCCA TAAGTGACAT CGGCATTACC AACTG CTTTA 2160 

ATATTTGTGG TTGGACTATA GCGATCAAAG AACCATTTCC CAGAAACATC AACGCCTGCC 2220 

GCATTTTGTT TCATATTCGT TTGTAAAGTG CGTAACACCT GATAAAGTGT ATTAAATTCA 2280 

AGTTCAATAC CATTATCATA GTGCTTTTCA ACACTTTCGA TTATACGGCT CATATTAATA 234 0 

CCTTTTTCGT CTTTTGTTAA ACTTGTTGAA AAACTAAATG TGCCAGCTGT TTGATACTGG 24 00 

TCAACAAGTA CAGGGTACAC TAAGTTTTTA ATACCAACTT CTTCTATTTC AAATAAAAAA 24 60 

35 TCTTTATGTG TACTTTGTAA ATCTGTCATT TCGTTCTTAG TAGTAGGTTT CGTGCCTTCA 2520 

ATAGGATCTA CGGAACCAAA GTGTTTCCAA CGACCTTCTC GTGTCGATAA ATCAAATTCA 2580 

GTCATTTTTT TCCTCCGTTA AGATTTAAAG TGATATGTCC AATATGGTTC GACTGTTAAA 264 0 

_ **?CTGTGTT_GTra^CATC^ GATTTCAGGA CTTGCTAATT^GTTTTAAAAA- TGGACCTGTT— 270 0 

TG AGAAG CAT GTGCTTCAAA TGCCTTAATT TTAAGTTCTT TAAAATCTGT AATATCATTT 2760 

TGAATATCAG GTTCTCCAAG AGCTTCGGTT GCATCATTAC TGAACGCAAC TAAAGTTAAA 2820 

CGAGGGCGTT CTTCTTTAGG CATGCGTTCA ACCGTTCGAA TTACAGCGTC TGCTGTTGCT 2880 

TCGTGATCAG GATGTACTGC ATATCCAGGA TAAAATGAAA TAATCAATGA TGGATTTGTA 294 0 

TCATCGATTA AAGATTTAAT CATACCATCT ATATGTTCAT AGGGTTCAAA TTCGACAGTT 3000 

TTGTCACGTA AACCCATTTT TCTTAAATCA GTAATACCGA TAACTTTACA AGCTTCTTCT 3060 

AGTTCACGCT CACGAATACT TGGTAATGAT TCGCGTGTTG CAAATGGGGG ATTAC CTAAA 3120 
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TAATTTGCTA ATGTGCCTGC AGATGAGAAG GTTT CAT CAT CAGGATGTGG AAATATTACT 324 0 

AATACATGTC TTTCGTCAGT CATGTTGATG CCTCCTCTAT AAATTAAATG GTCGCTCACT 3 3 00 

AATTTGAAGT GCTGCAGCGA GTTGACCTTC GTAATTAAAA CCTGCAATTA AAAATTCATC 3360 

ATGCTCATTG ACCTCAAAAT GCGTTAGACC TTGTACATAA ACCCAACCAC CATTTGATAG 34 2 0 

TTTAAGACCA ATGCGATAAG GTTCTTTATT ACCACCTTTT AGTTGTGCAT GCGTATATGT 34 8 0 

TATTTGTATG TTTCTTAAAA AAGTACCAGC ATTAAAAACA CGTTGATCGA AATGGTTCGC 3 54 0 

ATAGGCCCCA TTTGTCGTTT CAACATGCAG ATACACAGGT TTATGTTCAA AAGAAGCAAG 3 6 00 

/5 TAAATCTATA ACTTCTTGTT CTTTAATTGG TTCCAACACG TTCACTCCTT ACACTATCAA 3660 

TGTGTTTATC TTTCTATTTT ACTAAAAACT ATTCGATAAT TGTATACGAT TGCTCAATTA 3720 

TTTATAAATT AATTTTCATG AAGGGTAATT ACTCAGGATT ACGTAATCAT ACAGCATTAG 3780 

20 TTTTTTACTT TTAAAAATCA AAAATTTGTT GGAATTTGAA AAGTGTTAAA CATTAAAAAT 3 84 0 

GATGCTATAT TAATGGTGTA TGAATGAATT CATAAGTTTT TAAAATGTAT TAAATTTGTG 3 900 

GAGGCATGTA AACAATGAAA GTATTAAACT TAGGATCGAA AAAACAAGCA TCATTCTATG 3 96 0 

TTGCATGTGA GTTATATAAA GAGATGGCAT TTAATCAGCA CTGTAAACTA GGTTTAGCAA 4 020 

CTGGTGGTAC AATGACAGAT TTGTATGAAC AACTTGTTAA GTTGTTAAAT AAAAATCAGT 4 080 

TAAACGTAGA CAATGTATCC ACGTTTAATT TAGACGAATA TGTAGGTTTA ACCGCATCAC 414 0 

ATCCGCAAAG TTATCACTAT TATATGGATG ACATGCTTTT CAAACAATAT CCTTATTTTA 4 200 

ATAGAAAGAA CATTCATATT CCAAATGGAG ATG CCGATGA TATGAATGCG GAAGCGTgCA 4 2 60 

35 AAATATAATG ACGTTTTAGA ACAACAAGGT CAACGTGATA TTCAAATTTT AGGTATTGGT 4320 

GAAAATGGTC ATATTGGATT TAATGAACCT GGTACGCCGT TTGATAGCGT TACTCATATC 4 3 80 

GTTGffTTTGA CTGAAaGTAC TATTAAGGCT AATAGTCGAT ATTTTAAAAA CGAaGATGAT 444 0 

GTTCCAAAGC AAGCCATTTC GATGGGACTT GCTAATATTC TTCAAGCCAA ACGTATCATT 4 500 

TTACTCGCAT TTGGTGAAAA GAAACGTGCT GCTATTACAC ATTTATTAAA TCAGGAAATT 4 56 0 

TCTGTTGATG TTCCAGCCAC ATTACTTCAC AAACACCCGA ATGTTGAGAT ATATTTAGAC 462 0 

GACGAAGCTT GCCCGAAAAA TGTTGCGAAA ATTCATGTCG ATGAAATGGA TTGATTGCAA 4 6 80 

TGTTTAATTA AGAAATGCCT CGGGAAAGGT TCCAATAGAA AGATAAAAAG CATTGGAAGG 4 74 0 

ATGATTTTTA GTGGAATTAC AATTAGCAAT TGATTTATTA AACAAAGAAG ACGCGGCTGA 4 800 

GTTAGCAAAT AAAGTAAAAG ATTATGTAGA TATCGTAGAA ATCGGTACGC CAATCATTTA 4 860 

CAACGaAGGT TTACCAGCAG TTAAACATAT GGCAGACAAC ATTAGTAATG TAAAAGTATT 4 92 0 
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CGCGGATGTA ATTACAATAC TAGGTGTTGC AGAAGATGCA TCAATTAAAG CAGCTATTGA 
AGAAGCTCAT AAAAATAATA AACAATTACT AGTTGATATG ATTGCTGTTC AAGATTTAGA 
AAAACGTGCA AAAGAACTAG ATGAAATGGG TGCTGATTAT ATTGCAGTAC ACACTGGTTA 
TGATTTACAA GCAGAAGGGC AATCACCATT AGAAAGTTTA AGAACCGTTA AATCTGTTAT 
TAAAAATTCT AAAGTTGCAG TAGCAGGTGG AATTAAACCA GATACAATTA AAGATATTGT 

CGCTGAAAGT CCTGATCTTG TTATTGTTGG TGGCGGAATC GCAAATGCAG ATGATCCAGT 534 0 

AGAAGCTGCG AAACAATGTC GCGCTGCAAT CGAAGGTAAG TAATATGGCT AAATTTAGTG 5400 

15 ACTATCAATT AATTCTAGAT GAATTAAAGA TGACTTTGTC ACATGTTGAA GCGGATGAGT 5460 

TTTCAACTTT TGCATCCAAA ATACTACATG CTGAACATAT ATTTGTAGCT GGCAAAGGAC 5520 

GTTCAGGATT CGTGGCGAAT AGTTTTGCAA TGCGCTTAAA TCAGCTCGGC AAACAGGCAC 5580 

ATGTTGTTGG AGAATCAACG ACACCTGCGA TTAAGTCGAA TGATGTATTT GTAATTATCT 5640 

CTGGTTCAGG TTCCACGGAA CATTTAAGAT TATTAGCAGA CAAAGCAAAA TCAGTAGGTG 5700 

CTGACATCGT ATTAATTACT ACAAATAAAG ATTCTGCAAT AGGCAATCTA GCTGGGACGA 5760 

ACATCGTTTT GCCTGCAGGT ACAAAATATG ATGAACAAGG CTCGGCACAA CCATTAGGAA 5820 

GTTTGTTTGA ACAAGCATCT CAATTATTTT TAGATAGTGT TGTAATGGGA TTGATGACTG 5880 

AAATGAATGT TACGGAACAA ACGATGCAAC AAAATCATGC TAATTTAGAA TAAAATAAAG 5940 

ATAGTCGATA ATATGATGCC TAGGCAGAAA TATTATGGAT TATTTTTTTA TTTAAATAAT 6000 

AAATTATAGT ATAATATCAA TAATAAACGA ATAGGGGTGT TAATATTGAA GTTTGACAAT 6060 

35 TATATTTTTG ATTTTGATGG TACGTTGGCA GACACGAAAA AATGTGGTGA AGTAGCAACA 6120 

CAAAGTGCAT TTAAAGCATG TGGCTTAACG GAACCATCAT CTAAAGAAAT AACGCATTAT 6180 

ATGGSAATAC CTATTGAAGA ATCATTTTTA AAATTAGCAG ACCGACCATT AGATGAAGCA 6240 

GCATTAGCAA AGT TAATCGA TACATTTAGA CATACATATC AATjCTATTGA . AAAGGACTAT 6300- 

ATTTATGAAT TTGCGGGTAT AACTGAAGCC ATTACAAGTT TGTATAACCA AGGGAAAAAA 6360 

CTTTTCGTGG TGTCTAGTAA GAAGAGTGAT GTATTAGAAA GAAATTTATC GGCTATTGGA 6420 

TTAAATCACT TGATTACCGA AGCTGTTGGA TCCGATCAAG TAAGTGCATA TAAACCAAAT 64 80 

CCTGAAGGCA TACACACAAT TGTGCAACGC TACAATTTAA ATAGCCAACA AACGGTGTAT 654 0 

ATTGGTGATT CAACGTTTGA TGTTGAGATG GCACAACGTG CTGGTATGCA ATCTGCAGCT 6600 

GTCACTTGGG GTGCACATGA TGCAAGGTCA TTACTTCATT CAAATCCGGA TTTTATTATT 6660 
AATGATCCAT CAGAAATTAA TACCGTATTA TAAAACTTGT TAAAACAGAG AATACCATGG 
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ATTTAAAATA AATATTTATT AAACATTATG AATTTTTAAA GAGTAATGTC TGACTCGTTG 
ATAATTTATT TTTGTAAAAA TAAATTAAAG TAATGACAAA GTTATTGAAG TAAATTGAGT 

ATAAACATTT AAATACGATG TCGAAAATGG CGATAGCATA TCACTTACAT GAAGTTGTGT 6 960 

GctATCGCTA TTTTTAGTTA TAATTCCAAA AAGTTAATCG TTCGATGATT TAAGAATTAT 7 020 

TATTGTTTAA TTCAAATGTA TGAGGGTATA, AAATCATTGA ATTTAATTCG ATAAAGCGAA 7080 

ATTTTTGAAC AAACATACTT TTGTATTTAT ATAAAAGTTT AAATTCTTAT AAATTTGACA 714 0 

AAACTAATTA ACTCCGTATA ATTATGAAAC ATACAAGAGG GAG TGTATGA ATTCATGGAT 7200 

TTTAATAAAG AGAATATTAA CATGGTGGAT GCAAAGAAAG CTAAAAAAAC CGTTGTTGCA 7260 

ACCGGTATCG GTAATGCAAT GGAATGGTTC GATTTTGGTG TCTATGCATA TAcAACTGCG 7320 

TACATTGGAG CGAACTTCTT CTCTCCAGTA GAGAATGCAG ACATTCGACA AATGTTGACT 73 80 

20 TTCGCAGCAT TAGCCATTG C GTTTTTATTA AGACCAATTG GTGGTGTCGT ATTTGGTATT 744 0 

ATTGGTGACA AATATGGACG TAAAGTTG T A TTAACATCTA CAATTATTTT AATGGCATTT 7500 

TCAACATTAA CCATTGGATT ATTGCCAAGC TATGATCAAA TTGGACTTTG GGCACCAATA 7560 

CTATTATTGC TTGCAAGAGT ACTACAAGGG TTTTCAACAG GTGGAGAGTA TGCGGGGGCA 762 0 

ATGACATATG TTGCCGAATC ATCTCCAGAT AAGCGTCGTA ACTCATTAGG TAGTGGACTA 7680 

GAAATTGGGA CATTATCAGG TTACATAGCT GCTTCAATTA TGATTGCTGT ATTAACATTC 774 0 

TTTTTAACAG ATGAACAAAT GGCATCATTT GGTTGGAGAA TCCCATTCTT ACTCGGTTTA 7800 

TTCCTAGGAT TATTCGGCTT ATATTTACGT CGTAAGCTGG AAGAATCACG AG TTT T CGAA 7 860 

35 AATGATGTTG CAACACAACC AGAAAGAGAT AACATTAACT TTTTACAAAT CATCAGATTT 7920 

TATTACAAAG ATATATTTGT ATGTTTTGTA GCTGTTGTAT TCTTCaATGT TACAAACTAT 7980 

ATGGTAACTG CATATTTACC AACCTATTTA GAACAAGTTA TTAAATTAGA TGCAACGACA 804 0 

ACAAGTGTAT TAATTACTTG TGTCATGGCA ATAATGATTC CATTAGCATT AATGTTTGGT 8100 

AAGTTAGCGG ATAAAATAGG TGAAAAGAAA GTATTTCTAA TTGGTACTGG TGGGCTAACA 8160 

TTATTCAGTA TCATCGCATT TATGTTATTA CATTCACAAT CATTTGTTGT AATAGTAATC 8220 

GGTATATTTA TATTAGGATT TTTCTTATCA ACTTACGAAG CGACAATGCC AGGGTCGTTA 828 0 

CCAACGATGT TTTACAGTCA TATAAGATAT CGAACTTTAT CAGTAACATT TAATATCTCT 834 0 

GTTTCGATAT TTGGTGGTaC GaCGCCATTA GTkGCAmCaT GGTTaGTTAC GAAAACTGGA 84 00 

GATCCATTAG CmCCTGCGTA TTATTTAACA GCAATCAGTG TTATTGGCTT TTTAGTTATT 84 60 

ACATTCTTAC ATTTAAGTAC AGCAGGAAAA TCTCTAAAAG GTTCGTATCC AAATGTAGAT 8520 
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GAACGTAAGA 


ATTAGAGATT 


TTAATaAAAA 


GTATAAATCA 


ATCGTATATA 


AGCACTTTAA 


8640 




AGCTAGTAGG 


TTCTGCTAAC 


TTTAAAGTGC 


TTTTTAAATT 


GAGAACTGTA 


ATTAGCCGTA 


8700 


5 


ATAAAGTTTT 


TGTATATACA 


TAAACCCCCA 


CTGCAATGAT 


TATCGCAATG 


GGGGAAAGAG 


8760 




GGGACTTAAA 


GCATATGTTT 


AGCTTTGAAT 


ACTTAAAATT 


CTCTTGCTAT 


TGAAATGTTA 


8820 


10 


GGATGTAAAT 


ATGTCTTAGA 


GTATTTTGTC 


CAACGCAATT 


AATATTGAGA 


CTCTAACCTT 


8880 


CAATATTATT 


ATAGAGAACA 


CAAACTTAAA 


TAGATTGGGT 


GACTTATTTG 


TGTCAGTTAT 


8940 




TGCGATTGCG 


ATAACTTCTT 


TTCTCTATAT 


ACATATAGTA 


ACGTCTTATC 


TAATAAAAAA 


9000 


15 


CATGGTACTA 


CAGTATCAAA 


TTTATCTAGG 


GCTTAAGTTT 


GATTTTTATA 


ATAGGCAGGT 


9060 




TTACCTGATA 


AAAATACTTA 


TTCATTATAT 


AATGTTAACA 


ATATGTATTT 


TAAAGTTTAC 


9120 




ATTGAGTGAG 


GGATATTGAT 


GAACGTAATT 


TTAGAACAGT 


TGAAAACACA 


TACTCAAAAT 


9180 


20 


AAACCTAATG 


ACATAGCATT 


ACATATCGAT 


GATGAAACAA 


TTACATATAG 


TCAACTAAAT 


9240 




GCCCGCATCA 


CTAGCGCAgT 


TGAATCTTTG 


CAGAAATATT 


CACTTAACCC 


TGTCGTTGCT 


9300 




ATTAATATGA 


AATCACCGGT 


GCAAAGTATT 


ATTTGTTATT 


TAGCTTTGCA 


TCGTTTACAT 


9360 


25 


AAAGTGCCTA 


TGATGATGGA 


AGGTAAATGG 


CAAAGTACTA 


TACATCGTCA 


ATTGATTGAA 


9420 




AAATATGGTA 


TTAAAGATGT 


AATTGGAGAT 


ACAGGTCTCA 


TGCAGAATAT 


AGACTCACCG 


9480 




ATGTTTATTG 


ATTCAACGCA 


ATTACAGCAC 


TACCCCAATT 


TATTACATAT 


TGGTTTTACT 


9540 


30 


TCAGGGACAA 


CTGGACTGCC 


AAAAG CAT AT 


TATCGTGATG 


AAGATTCATG 


GTTGGCTTCT 


9600 




TTTGAAGTTA 


ATGAAATGTT 


GATGTTAAAA 


AATGAAAATG 


CAATAGCAGC 


CCCTGGACCA 


9660 


35 


CTATCGCACT 


CGTTAACATT 


ATATGCGTTA 


TTGTTTGCTT 


TAAGTTCCGG 


TCGTACTTTT 


9720 


ATAGGACAGA 


CCACTTTTCA 


TCCTGAAAAG 


TTACTTAATC 


AATGTCATAA 


AATATCATCA 


9780 




TACAAAGTTG CTATGTTTCT 
AATGAACATA CAATCCAATC 


TGTTCCAACG 


ATGATTAAAT 
AGTGGAGATA 


CATTATTGTT 


AGTTTACAAC 


9840 




attttttagc 


AGCTGCATTC 


TTCTATTTTT 


9900 




AAAAAGATAA 


AAAATCAAGC 


AAATGACATA 


AATTTGATTG 


aattttttug 


TACATCGGAA 


9960 




ACCAGTTTTA 


TCAGCTATAA 


CTTGAATCAG 


CAAGCACCAG 


TTGAATCAGT 


AGGTGTGCTA 


10020 


45 


TTTCCAAATG 


TGGAATTGAA 


AACAACGAAT 


CACGATCACA 


ATGGTATAGG 


AACTATTTGT 


10080 




ATAAAAAGTA 


ATATGATGTT 


TAGTGGCTAT 


GTAAGTGAAC 


AATGTATAAA 


TAATGATGAA 


10140 




TGGTTTGTTA 


CTAATGATAA 


TGGCTATGTA 


AAAGAGCAGT 


ATTTATATTT 


AACGGGACGT 


10200 


50 


CAACAGGATA 


TGTTAATTAT 


TGGTGGTCAA 


AATATATATC 


CAGCACATGT 


TGAACGCCTT 


10260 




TTAACGCAAT 


CTTCGAGCAT 


TGATGAAGCA 


ATTATCATCG 


GTATTCCAAA 


TGAGCGTTTT 


10320 
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CAATTTTTAA AAAAGAAAGT GAAaCgnTaT 


GAAATTCCAT 


CGATGATTCA 


TCATGTAGAA 


X0440 




AAGATGTATT 


ACACTGCAAG 


tGGTaAAATT 


GCTAGAGAAA 


AAATGATGTC 


GATGTATTTG 


10500 


5 


AGAGGTGAAT 


TATAATATGA 


ATCAAGCAGT 


CATAGTTGCA 


GCTAAACGAA 


CTGCATTTGG 


10560 




GAAATATGGT 


GGCACTTTAA 


AACATTTAGA 


GCCaGAACAA 


TTGCTTAAAC 


CTTTATTCCA 


1062O 


10 


ACATTTTAAA 


GAGAAGTATC 


CAGAGGTAAT 


ATCTAAAATA 


GATGATGTAG 


TTTTAGGTAA 


10680 


TGTTGTTGGG 


AATGGTGGCA 


ATATTGCAAG 


AAAAGCATTG 


CTTGAAGCGG 


GGCTTAAAGA 


10740 




TTCAATACCT 


GGCGTCACAA 


TCGATCGGCA 


ATGTGGGTCT 


GGACTTGAAA 


GTGTTCAATA 


10800 


15 


TGCATGTCGC 


ATGATCCAAG 


CCGGAGCTGG 


CAAGGTATAT 


ATTGCAGGTG 


GTGTTGAAAG 


10860 




TACAAGTCGA 


GCACCTTGGA 


AAATCAAACG 


ACCGCATTCT 


GTGTACGAAA 


CAGCATTACC 


10920 




TGAGTTTTAT 


GAGCGTGCAT 


CATTTGCACC 


TGAAATGAGC 


GACCCATCAA 


TGATTGAAGG 


10980 


20 


TGCTGAAAAT 


GTGGCCAAGA 


TGTATGATGT 


TTCAAGAGAA 


TTACAAGATG 


AATTTGCTTA 


11040 




TCGAAGTCAT 


CAATTGACAG 


CGGAAAATGT 


AAAGAATGGA 


AATATTTCTC 


AGGAAATATT 


11100 




ACCTATAACC 


GTTAAAGGAG 


AAATATTCAA 


CACTGATGAA 


AGTCTAAAAT 


CACATATTCC 


11160 


25 


GAAAGATAAC 


TTTGGCCGAT 


TTAAGCCCGT 


GATCAAAGGT 


GGGACCGTTA 


CCGCTGCGAA 


11220 




TAGTTGTATG 


AAAAATGATG 


GTGCAGTTTT 


ATTGCTTATT 


ATGGAAAAAG 


ATATGGCATA 


11280 


30 


CGAATTAGGT 


TTCGAGCATG 


GTTTATTATT 


TAAAGATGGT 


GTTACGGTAG 


GTGTTGATTC 


11340 


TAATTTTCCT 


GGCATTGGTC 


CAGTACCAGC 


CATTTCCAAC 


TTACTAAAAA 


GAAATCAATT 


11400 




AACGATAGAA 


AATATTGAAG 


TCATTGAAAT 


TAACGAAGCG 


TTCAGTGCAC 


AGGTAGTTGC 


11460 


35 


CTGCCAACAA 


GCTTTAAATA 


TTTCAAATAC 


GCAATTAAAT 


ATATGGGGTG 


GTGCATTAGC 


11520 




ATCAGGTCAT 


CCATACGGTG 


CAAGCGGTGC 


CCAATTAGTG 


ACTCGATTAT 


TTTATATGTT 


11580 




TGACAAAGAG 


ACTATGATTG 


CATCTATGGG 


GATAGGGGGA 


GGTCTAGGAA 


ATGCAGCATT 


11640 


40 


ATTTACTCGA 


TTCTAACCAG 


CGATTAAATG 


TGTCATTTTC 


TAAGGATAGT 


GTGGCTGCAT 


11700 




ATTATCAGTG 


TTTTAACCAA 


CCTTATAGAA 


AAGAAGTACC 


AC CATT AATG 


TGTGCGTCAT 


11760 




TATGGCCAAA 


ATTTGATTTA 


TTTAAAAAAT 


ATGCAAATAG 


CGAACTGATT 


TTAACAAAAT 


11820 


45 


CAGCAATTAA 


TCAAACTCAA 


AAGATAGAAG 


TAGACACAAT 


ATATGTAGGG 


CATTTAGAAG 


11880 




ATATTGAATG 


CCGACAGACT 


CGCAATATCA 


CACGTTATAC 


AATGGCTTTA 


ACATTAACTA 


11940 




AAAATGATCA 


ACATGTCATA 


ACGGTtACAC 


AAACTTTTAT 


TAAGGCGATG 


AAGTAGAGAT 


12000 


50 


GGAGTTTAAT 


GAGATATCGA 


TAAATGAATA 


TTTGGCGCTC 


GTAAATGATG 


ATAATCCAAT 


12060 




ACATAATGAG 


ATTGTGCCAG 


GACAATTAGT 


GAGTCAAATG 


ATGCTGATGG 


CTATGTCATT 


12120 
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ATTCATTGAA CAACACGAAC ACGAAATTAT AG CAATT AAT GACGATGGAG AGATTAAAAT 1224 0 

AAAAATTTCT TTGAGCACAA AAAAATAACC GATATTAGCT GCATGAACGC ATATTAATTA 123 00 

GGAGATGAAA GGACAGCTAA TATCAGTTAT GTATTGTTAT TATTATTGGG AACAGAGATG 123 60 

AATATAGGTT ACGTTTCTTT CTTTGCACGG GGATGCATTA ATCTAAAATA ATAATAACAA 124 20 

CTATATCAAT GTTTAATAAA TTCTGGATTA TTGGAACGAT TAGTCAATTT AACTAACTTT 124 80 

CATATGATCT ATATCGTCTT GTAATAAAGA GAGCAATTTG AATATTTCAG TAT CACTAAA 12 540 

TGAATCGTCA CATTTAATTG AAACATGCTG AAACGTTTTG GTTATAATTT CATAAACTGG 12600 

TGCGCCTTCA TGGTGATACT GTCGATAAAT AATCATAACC TATATTACCT CCTTTGCTAC 12660 

TCTATGGTTA TATTATAAAT AACATTTTTA TGTGTGACAT CAACCTTAAG TATCAACTTT 12720 

TTATCAGACA TAGAACGTAT GATTTACTAA GACTATTTAT GTATAAAAGT TCTAAATAAA 12780 

20 TATATATTTA TAGAGTCGCC TGGCAGTCAT TTGGGaAATA TAACATATAT GATTAGAGAG 1284 0 

GCATCTATCG CAAAAGAATG ATAATGATAG AGGTATTGAG CATATAGATG AGTTTAAGTT 12900 

CATCTTGAAA ATAAAGGGTT ATTTAGTCAT AGATGTAGAT GTATAGGAAA TATTTGTATG 12960 

TATTGTTCGA TATGTATGAA ATTTTCAATA AAAGCTAATA ACGCTTATAT GTAACTTTCA 13020 

AATTTAAATT ATATACAGAG CATGATGATT ATAAAAAAAT AACCACATCA CATAAATTGA 13 080 

GTTCATACCC AATTTAAGTG GTGTGGCTAA TAATGTTGAT TTATAGATGA ACCGCCTAAT 13140 

CGTTAAACCT CTGTTACTTC AACATCGATA TGTTCAATAC GGTTGTATGC AC CGTGATCC 13200 

ACAGGACCAA CAAAATCATT CATTTTCCAA CCG TTTTTAA TAGCAGAAGC GACGAAAGCT 13260 

TTCGCGCTAA TCACAGCTTC TTTCGGTGAC TTACCGTTAG CTAAATATGC AGTTGTTGCC 13320 

GCAGCAAATG TACAACCAGC ACCATGGTTA TAACTTTGTT GGAACATGTC TGTTGTTAGT 133 80 

TGATAAAATG TTTGACCATC ATAGTATAAG TCATACGATT TATCTTGATC TAAAGCTTTG 13440 

40 CCACCTTTAA TGATGACATG CTGTGCGCCT TTATCAAAGA TAATTGTTGC AGCCTTTTTC 13 500 



25 



30 



35 



ATATCTTCAA TTGAATTTAA TTTACCTAAT CCTGATAATT GACCCGCTTC AAATAAGTTT 13 56 0 

GGTGTCACTA CCGTTGCTTT AGGTAGTAAA TATTTAATCA TCGCCTCAGT ATTTCCAGGA 1362 0 

45 TTAAGCACTT CATCTTCGCC TTTACAAACC ATGACAGGAT CTACTACAAA ATATTGTGCA 136 80 

TTAGATGCCT CATATACTTC TCCAGCACGT TTGATTATCT CCTCAGTACC TAACATACCT 13740 

GTTTTAATAG CATCAGGTCC GATTGATAAA GCCGTTTCAA GTTGTTTTTC AAATACATCC 13 800 

SO 

ATTGGTAATG GTGTAACATC GTGTGACCAT GTATCTTTAT CCATAGTAAC GATGGCAGTT 13 860 

AAAGCGACCA TGCCATACGT ATCTAATTCT TGGAACGTTT TCAAATCTGC TTGCATACcT 13 920 
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CACTCCTACA 


TAATAATATT 


GTATTCATCA 


TATCATTTTT 


AACCTAATTG 


AAAAATATTA 


14040 




AGCATTCAAT 


ATTTGATGAT 


TGTTGAAATG 


AATCATTCAT 


ACTATTGTAA 


CTTTTGAAAA 


14100 


5 


TGTCATTCAC 


TTTAGATAAG 


TGTGATATGT 


TAAAATATGT 


CCTGAGGTGA 


GATTGAATGG 


14160 




AATGGTCGCA 


AATTTTTCAT 


GACATAACAA 


CGAAACATGA 


CTTTAAAGCT 


ATGCATGATT 


14220 


10 


TTTTAGAAAA 


AGAATATTCG 


ACTGCAATCG 


TATACCCTGA 


TAGGGAAAAT 


ATATATCAAG 


14280 


CGTTTGATTT 


AACACCGTTT 


GAAAATATCA 


AAGTTGTTAT 


ATTAGGACAA 


GACCCGTATC 


14340 




ATGGTCCAAA 


CCAAGCACAT 


GGATTAGCAT 


TTTCAGTGCA 


ACCTAACGCA 


AAATTCCCTC 


14400 


15 


CATCTTTACG 


TAATATGTAT 


AAAGAATTAG 


CAGATGATAT 


TGGATGCGTT 


AGACAAACAC 


14460 




CGCATTTACA 


AGATTGGGCA 


AGAGAAGGCG 


TCTTGTTATT 


GAATACAGTT 


TTAAC CGTAA 


14520 




GACAGGGTGA 


AGCAAATTCT 


CATCGTGATA 


TTGGTTGGGA 


AACATTTACT 


GATGAAATTA 


14580 


20 


TTAAAGCAGT 


GTCTGATTAT 


AAAGAACATG 


TTGTCTTTAT 


TTTGTGGGGG 


AAACCTGCAC 


14640 




AGCAAAAAAT 


AAAGCTTATC 


GATACATCTA 


AACATTGTAT^ 


TATAAAATCA 


GTGCATCCTA 


14700 




GTCCACTGTC 


TGCATATAGA 


GGATTCTTTG 


GATCAAAACC 


GTATTCCAAA 


GCGAATGCCT 


14760 


25 


ATTTAGAGTC 


AGTAGGAAAA 


TCACCAATTA 


ATTGGTGTGA 


• 

AAGTGAGGCG 


TAGATGTTGA 


14820 




ATAGAGAAAC 


TTTAATAGCA 


CGAATTGAGC 


AAGAATTAGT 


ACAAGCAGAG 


CAGGCACAGC 


14880 


30 


ATGACCATGA 


CTTTGAAAAA 


CATATGTATG 


CCATACATAT 


ATTAACATCT 


TTATATG CTT 


14940 


CAACATCAAA 


TACACCACAT 


ATTGGTGAAC 


AACAAATGAA 


TCGTCGTATT 


GCTAACCATA 


15000 




ATCAAATGCC 


ACAATCACAA 


ATAACGCAGC 


CAACTCATCA 


AGTGACAGTT 


GCTGAAATTG 


15060 


35 


AAGCGATGGG 


TGGTAAAGTA 


AATACGCATT 


CAGCACATCA 


TCATAATAAG 


TCATATTCAC 


15120 




AACCTTCAAA 


CCAACAACAA 


AGATTAGCGA 


CAGATGATGA 


CATTGGCAAT 


GGTGAATCCA 


15180 




TATfitGATTT 


TTAAAAAGCA 


ACAATGAAAC 


ATAATTACTT 


AATAGCTTGT 


TAAGTATGTA 


15240 


40 


GGTTAATAAT 


CAAGACGCAT 


ATACTTTTAT 


TCGAGTGTTC 


GGATTTAAAC 


ATTTATTAAT 


15300 




ACTGAATTAT 


ATAAGGAGAG 


GTAGCAATGA 


AATTATTTAT 


TATTTTAGGT 


GCATTAAACG 


15360 




CGATGATGGC 


TGTCGGTACA GGTGCATTTG 


GTGCGCATGG 


TTTACAAGGA 


AAAATAAGTG 


15420 


45 


ATCACTATTT 


ATCAGTATGG 


GAAAAAGCAA 


CGACGTATCA 


AATGTACCAT 


GGCTTAGCAT 


15480 




TATTAATTAT 


AGGTGTAATT 


AGTGGTACAA 


CTTCAATCAA 


TGTTAACTGG 


GCTGGCTGGT 


15540 




TAATATTTGC 


TGGTATTATT 


TTCTTTAGTG 


GATCATTATA 


TATTTTAGTA 


TTAACTCAAA 


15600 


SO 


TTAAAGTTTT 


AGGTGCGATT 


ACGCCAATTG 


GTGGCGTATT 


GTTCATCATT 


GGATGGATAA 


15660 




TGTTAATCAT 


TGCGACATTC 


AAATTTGCTG 


GTTAAATTTT 


AAAACTTTAG 


ATTAC CTATG 


15720 



55 



BNSOOaO- <EP 078fk5WA? I > 



635 



TGGGTATAGA ATACCTTCGA GGTGAGTTTT 
ATAGAGGCGA TTTAAAACAA AACCTATCTG 

5 

CATGTATCGG ATGGGGCGCA TTCATCTTAC 
TTGCAGCATC AATTGGTATA GTTATTGGTG 
ATGGCGCATT AGTAGAGAGA TTTCCAGTAT 

10 

GTTTCGGCAG ATATGTGAGT TTCTTCTCAT 
TCGTTGCTTT AAA t GCGACC GCATTCAGTT 

15 TAAATAATGG GAAACTATAC ACCATTGCGG 

TTGCGACCGT ATTACTACTT GTATTCATGC 
GATCATTACA ATATTATTTC TGTGTGGCGA 

20 GTTCATTCTT TGGTAATAAT TTTGCACTTG 

AAGGATGGTT AGTGTCTATT GTGGTTATTG 
TTGATAATAT TCCACAAACA GCAGAAGAGT 

25 TTATCGTGTA CAGTTTATTA GCAGCATCAT 

GTTGGTTATC AACAAGTCAT CAAAGTTTAA 
CACAAACAGC ATTTGGTTAT ATTGGATTAG 

30 

TATTTACTGG TTTAAATGGA T TCTTGATGA 
GTT CAGGTAT TATGCCAACA ATGTTTAGTA 
TCGCAATCAT ATTCCTAGTA GGAGTGTCGT 

35 

TGACTTGGAT TGTAGATATG T CAT CT ACTG 
TGTCTGCAGC GAAATTATTC AGTTATAACA 

40 AAACGTTTGC TATTATCGGC TCATTTGTAT 

CAGGTTCTCC TGCAGCACTG ACTGCACCGT 
TCGGTTTAAT ATTCTTTGTG ATTCGATATC 

46 TAAGTCGCTT GATTTTAAAT AGAAGTGAAA 

AAAAAGAAAA AACTAAATAA TAAAAGAATC 
ATCGTGCGAT TTTTTGTATT ATAAATTGAC 

50 

TAATTGCTAA GAGTTAGGGC TGAGCCATTT 
TTCACGAACC CAGAAACAAT TAATTTGGAA 

55 
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TATTTATGGA 


AAAAAAGAAT 


AAG CAAAT AG 


15840 


AAAAGTTTGT 


ATGGGCGATT 


GCATATGGTT 


15900 


CAGGAGACTG 


GATTAAGCAG 


TCAGGTCCGA 


15960 


CATTATTAAT 


GATATTAATT 


GCGGTTAGTT 


16020 


CAGGGGGCGC 


GTTTGCCTTT 


AGTTTCTTAA 


16080 


CATGGTTTTT 


AACTTTTGGT 


TATGTCTGTG 


16140 


TACTAGTTAA 


ATTCTTATTG 


CCAGATGTCT 


16200 


GCTGGGACGT 


TTATATTACG 


GAAATCATTA 


16260 


TAGTAACGAT 


TCGTGGCGCA 


AGTGTATCTG 


16320 


TGGTAATCGT 


CGTATTATTG 


ATGTTCTTTG 


16380 


AAAATTTACA 


ACCGTTAGCT 


GAACCTAGCA 


16440 


TATCCGTGGC 


ACCATGGGCA 


TATGTTGGAT 


16500 


TTAACTTTGC 


ACCAAACAAG 


ACATTTAAGC 


16560 


TAACTTATGT 


TGTCATGATT 


TTATACACTG 


16620 


ATGGGCAGTT 


GTGGTTAACA 


GGTGCTG t TA 


16680 


GTGTATTAGC 


AATTGCAATT 


ATGATGGGTA 


16740 


GTTCAAGTCG 


CTTGTTATTT 


TCTATGGGAC 


16800 


AATTACATAG 


TAAATACAAA 


ACACCATATG 


16860 


TAATTGCACC 


TTGGCTAGGA 


AGAACTGCAT 


16920 


GTGTATCCAT 


TGCCTACTTT 


ATTACATGTT 


16980 


AACAAAGTAA 


TACGTATGCA 


CCGGTTTACA 


17040 


CATTCATTTT 


CTTAGCGTTG 


TTATTAGTGC 


17100 


CTTATATTGC 


ATTACTTGGA 


TGGTTAATCA 


17160 


CTAAATTGAA 


AAATATGGAT 


AATGATGAAT 


17220 


ATGAAGTTGA 


TGATATGATT 


GAAGAACCTG 


17280 


GCACAATAAA 


CCTTCTTCAT 


TCGGAGGCGT 


17340 


ATTTAAGACG 


AGGCAGCTGA 


ACCTTATATA 


17400 


CTAACAAATA 


TTTATAATCG 


TTTAAAAGAT 


17460 


ATTTGGTCGG 


CGAATAATAA 


ACCTAATGCG 


17520 
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AAGACTAAAT TTTTTGTAGC ATCGTATGCT AAGCCACCAG GTACTAATGG AATGATACCC 1764 0 

GTTACCATAA AAATGATGGC AGGTTCTTTT TGTTTACGAG CCATATAATG ACTTAACAAG 17700 

CCTAATGCTA AACTACCAAA GAAACTAGAG TATATAGTGT GCACATTAAA GCCGTTGAAG 17760 

AATAAGGTGT AAACCATCCA TCCACACGTA CCAACGAAAC CACATGATAG ATATAATTTT 17820 

CTAGGTGCAT CAAAAATGAC GCAGAA 17846 
(2) INFORMATION FOR SEQ ID NO: 110: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5544 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 110: 





ATTGACACTT 


GGTGAAAGTA 


ATATCGCCGC 


GCTATTTTGG 


CAAAATGGAC 


ACTTAGAACC 


60 




TGAGTTACAA 


GATGAACAGC 


CAATTAATAT 


ATTAGGATCT 


GkTCAAATCA 


ACGAATGGAA 


120 


25 


TGGTAATCAA 


TCACCGCAAA 


TAATTATTCA 


AGATATTGCG 


ATGAATGAAC 


AGCAAATATT 


180 




AGATTATAGA 


AGTAAGCGAA 


AAAGTTTACC 


TTTTACAGAA AATGATGAAA 


ATATTGTCGT 


240 




GCTTATTCAT 


CCTAAAAGTG 


ATAAAGTAAA 


TGCGAATGAA 


TATTATTATG 


GTGAAGAAAT 


300 


30 


TAAACAACAA 


ACTGATAAAG 


TAGTATTAAG 


AGATTTACCA ACGTCAATGG 


AAGACTTGTC 


360 




TAATTCCTTG 


CAACAACTGC 


AATTTTCTCA 


ACTTTATATA 


GTTTTGCAAC 


ATAATCATTC 


420 


3S 


GATTTACTTC 


GATGGTATAC 


CTAATATGGA 


TATTTTTAAA 


AAGTGTTATA 


AAGCATTAAT 


480 


AACTAAACAA 


GAAACAAATA 


TCCAGAAAGA 


GGGTATGTTA 


TTGTGTCAAC 


ATTTAAGTGT 


540 




GAAAfCAGAT 


ACACTTAAAT 


TCATGTTGAA 


AGTTTTCTTA 


GACTTAAAAT 


TTGTAACACA 


600 


40 


AGAAGATGGT 


TTAATTCGAA 


TCAATCAACA 


ACCTGATAAA AGATCGATTG 


ATTCCAGCAA 


660 




AGTATATCAA 


TTAAGACAAC 


AACGTATGGA 


TGTTGAAAAG 


CAATTATTAT 


ATCAAGATTT 


720 




TTCAGAAATA 


AAAAATTGGA 


TAAAGTCACA 


ATTGTCGTGA 


GCAATTTAGG 


AGGAAATATT 


7B0 


45 


AATGGATTTA 


AAGCAATACG 


TATCAGAAGT 


TCAAGATTGG 


CCGAAACCAG 


GTGTTAGTTT 


840 




CAAGGATATT 


ACTACAATTA 


TGGATAATGG 


TGAAGCATAT 


GGCTATGCAA 


CAGATAAAAT 


900 




TGTAGAATAC 


GCAAAAGACA 


GAGATGTTGA 


TATCGTTGTA 


GGACCTGAAG 


CGCGTGGCTT 


960 


50 


TATCATTGGC 


TGTCCTGTAG 


CTTATTCAAT 


GGGGATTGGC 


TTTGCACCTG 


TTAGAAAAGA 


1020 




AGGGAAATTA 


CCTCGTGmAG 


TCATTCGTTA 


TGAGTATGAC 


CTAGAATATG 


GTACAAATGT 


1080 
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ATTAGCTACT GGTGGTACGA TTGAAGCAGC AATAAAATTA GTTGAAAAAT TAGGCGGTAT 1200 

CGTAGTAGGT ATTGCATTTA TAATTGAATT GAAATATTTA AATGGTATTG AAAAAATTAA 1260 

AGATTACGAT GTTATGAGTT TAATCTCATA CGACGAATAA TAAATAATAT AATTTTATCA 1320 

AATGAAATCC TTCATCAAAT GTATAAGAAC CAATGACTTA ATTAAAAAAG TTGTTTAAGT 1380 

TTTCTTAACA TGAGATGTTA GGATTTTTTA TTTACTGAAA ATGTTAGATG ATTGAGCATT 144 0 

ATAC CTTAAT AACATCGTTT ATTTATTTCA TAAATTGTAG TATCATAGAA CTAATATTTA 1500 

AAAAATGAAA CAGTAGATTT AGGTCGAATT TTTGTAAAAG TTTTAAAAGT AGGAATAGTA 1560 

TACAAATTAA ACTCGCTCAA GTAAAATTAA TATTACGATT AATGACGACA GGATAAATAT 1620 

TTATCGTCGA CGGACGTATG ATTGGTGTGG GACAAATACT ATTCAACAAG AGTACCTAAA 1680 

TCATTGTTTA AGGCGAAGTA ATAAATATGA ATGGGGTGTA TCATATAATG AACAACGAAT 1740 

20 ATCCATATAG TGCAGACGAA tTCTTCACAA AGCAAAATCA TATTTGTCAG CAGATGAATA 1800 

TGAGTATGTT TTAAAAAGCT ATCATATTGC TTATGAAGCA CATAAAGGTC AGTTCCGAAA 1860 

AAACGGATTA CCATACATTA TGCATCCTAT ACAAGTTGCA GGTATTTT A A CAGAAATGCG 1920 

ATTAGACGGA CCGACGATTG TCGCAGGTTT TTTGCATGAT GTAATTGAAG ATACACCGTA 19B0 

TACATTTGAA GATGTAAAAG AAATGTTCAA TGAAGAAGTT GCTCGAATTG TTGATGGTGT 2040 

GACGAAGCTT AAAAAAGTAA AATACCGCTC AAAAGAAGAA CAACAAGCTG AAAATCATCG 2100 

CAAGTTATTT ATTGCGATTG CCAAAGATGT ACGCGTAATT TTGGTGAAAT TAGCAGACAG 2160 

ATTACATAAT ATGCGTACCT TGAAAGCCAT GCCGCGCGAA AAACAAATTA GAATTTCTCG 2220 

AGAAACATTA GAAATTTATG CACGATTAG C ACATCGTCTT GGTATTAATA CAATCAAATG 2280 

GGAACTAGAA GATACGGCTC TTCGTTATAT TGATAATGTG CAATATTTTA GAATAGTCAA 2340 

TTTAATGAAG AAGAAACGTA GTGaACGTGA AGCGTATATC GAAACGGCTA TTGATAGAAT 2400 

ACGTACTGAA ATGGACCGAA TGAATATCGA AGGCGATATA AATGGTAGAC CTAAACATAT 2460 

TTACAGTATT TATCGGAAAA TGATGAAGCA GAAAAAACAA TTTGATCAAA TTTTTGATTT 2520 

GTTGGCGATA CGTGTTATTG TCAATTCTAT TAATGATTGT TATGCGATAC TTGGGTTGGT 2580 

45 GCATACGTTA TGGAAACCGA TGCCAGGACG TTTTAAAGAT TATATTGCAA TGCCTAAACA 2640 

AAATTTGTAT CAGTCATTGC ATACTACAGT AGTAGG CCCA AATGGAGACC CGCTCGAAAT 2700 

CCAAATACGA ACGTTTGATA TGCACGAAAT TGCTGAGCAT GGTGTTGCAG CACACTGGGC 2760 

SO 

TTACAAAGAA GGTAAAAAAG TAAGTGAAAA AGATCAAACT TATCAAAATA AGTTAAATTG 2 820 

GTTAAAAGAA TTAGCTGAAG CGGAT CATAC AT CGTCTGAC GCTCAAGAAT TTATGGAAAC 2880 

55 



30 



35 



40 
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TGAGTTGCCA TATGGTGCTG TGCCGATTGA TTTTGCTTAT GCGATTCACA GTGAAGTAGG 3000 

TAATAAGATG ATTGGTGCCA AGGTGAATGG CAAAATTGTA CCAATTGACT ATATTTTACA 3060 

AACAGGCGAT ATTGTTGAAA TACGTACTAG TAAACATTCA TATGGACCAA GTCGTGATTG 3120 

GTTGAAAATT GTTAAATCGT CTAGTGCCAA AGGTAAAATT AAAAGTTTCT TCAAAAAACA 3X80 

AGATCGTTCA TCTAATATTG AAAAAGGCCG AATGATGGTT GAAGCTGAAA TAAAAGAGCA 3240 

AGGATTTAGA GTCGAAGATA TTTTGACAGA GAAAAATATT CAGGTTGTTA ATGAAAAATA 33 00 

TAACTTTGCA AATGAAGATG ATTTATTCGC AGCTGTAGGA TTTGGCGGCG TGACATCCTT 33 60 

ACAGATTGTT AATAAATTAA CTGAAAGACA ACGTATTTTA GATAAACAAC GTGCTTTAAA 34 20 

TGAAGCACAA GAAGTTACGA AATCATTGCC TATTAAAGAC AACATCATTA CTGATAGTGG 34 80 

TGTCTATGTA GAAGGTTTAG AAAATGTACT TATCAAGTTG TCAAAATGTT GTAATCCTAT 3540 

20 ACCaGGTGAT GATATTGTAG GTTATATCAC CAAAGGTCAC GGTATTAAAG TACATCGCAC 3600 

TGATTGCCCA AATATTAAGA ACGAAACTGA ACGACTAATT AATGTTGAAT GGGTAAAATC 3 6 60 

AAAAGACGCA ACTCAAAAAT AT CAGGTTG A TTTAGAGGTA AtGCGTATGA CCGAAATGGC 3720 

25 TTGTTGAATG AAGTACTACA AGCTGTTAGC TCGACAGCCG GCAATTTAAT TAAAGTTTCA 3780 

GGACGTTCAG ATATTGATAA AAATGCAATA ATAAATATTA GTGTCATGGT GAAAAACGTG 3 84 0 

AATGATGTTT ATCGTGTGGT AGAAAAGATC AAACAACTTG GTGATGTTTA TACAGTAACA 3 900 

AGAGTTTGGA ACTAGAGGTG CAAAATATGA AAGTAGTTGT ACAAAGAGTT AAAGAAGCAT 3 960 

CGGTGACGAA TGATACATTA AATAATCAAA TCAAAAAAGG ATATTGTTTA TTAGTCGGTA 4 020 

TCGGTCAGAA CTCTACAGAG CAAGATGCAG ATGTAATTGC AAAGAAAATT GCTAATGCAA 4 080 

GATTATTTGA AGATGACAAT AATAAATTAA ACTTTAATAT CCAACAAATG AATGGTGAAA 414 0 

taceatcagt TTCACAATTT ACTCTCTATG CAGATGTAAA AAAAGGTAAC CGTCCAGGTT 4200 

TCTCAAATTC TAAAAATCCT GATCaAGCGG TAAAAATTTA TGAGTATTTT AATGcaTGCG 4260 

CTACGAGCGT ATGGTCTTAC TGTGAAAACA GGTGAATTTG GAACACACAT GAATGTTAGC 4 320 

ATAAATAATG ATGGTCCAGT CACTATTATT TATGAAAGTC AGGACGGCAA AATTCAATGA 4 3 80 

-*$ AAAAAATAGA GGCATGGTTA TCTAAAAAGG GTCTTAAAAA TAAACGTACT CTAATAGTAG 44 4 0 

TGATTGCCTT TGTCTTATTT ATCATCTTTT TATTTTTATT GCTGAATAGC AATAGTGAAG 4 500 

ATAGTGGGAA CATCACGATA ACTGAAAATG CTGAATTACG TACAGGTCCA AACGCTGCGT 4 560 

so 

ATCCAGTCAT ATATAAAGTT GAAAAAGGTG ACCATTTTAA AAAGATTGGT AAAGTAGGTA 4 620 

AATGGATTGA AGTTGAAGAT ACATCCAGTA ATGAAAAAGG TTGGATAGCT GGATGGCACA 4 680 
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TAGTGCTTGA TCCTGGTCAT GGAGGTAGTG ACCAGGGTGC TTCAAGCAAT ACTAAATATA 
AAAGTTTAGA AAAAGATTAT ACGTTGAAAA CAGCAAAAGA ATTGCAGCGT ACTTTAGAAA 
AAGAAGGCGC AACTGTTAAG ATGACAAGAA CAGACGATAC ATATGTTTCA CTAGAAAATC 
GTGATATCAA AGGCGATGCC TATTTGAGTA TACATAATGA TGCGTTAGAA TCATCTAATG 
CAAATGGAAT GACaGTTTAT TGGTATCATG ATAATCAAAG AGCTTTAGCA GATACGTTAG 
ACGCTACGAT TCAGAAGAAA GGTCTACTTT CTAATCGCGG TTCAAGACAA GAAAATTATC 
AAGTGTTAAG ACAAACAAAA GTTCCTGCTG TTTTATTAGA ATTAGGTTAT ATTAGTAACC 5160 
CAACTGATGA AACGATGATT AAAGATCAAT TACATAGACA AATTTTAGAA CAAGCAATTG 5220 
TTGATGGCCT TAAAATTTAT TTTTCTGCGT AGGGCTTGCA AAAATATGTG AAAGTAGTTA 5280 
TCATTGATAT TGAATTTTAT AACTAAAACC GTTAGTATTC TTGAAATGGT AAATGAAATA 5340 
20 GGTAGCAATC TAACTAAGAT TGTGTAGGAA TATAATCGAT AGACTGAAAG ATTATGCTGA 

GTAGTTTATA TACATTGAAC ACAAGAAGAG GTGCTTTATG AAAAGTAAAG CCGTTAAACG 



75 



55 



CAATTAGGCA TGTTTTTTAA ACCA 

(2) INFORMATION FOR SEQ ID NO: 111: 

(i) SEQUENCE CHARACTERISTICS: 
30 (A) LENGTH: 1067 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



35 



45 



50 



4800 
4860 
4920 
4980 
5040 
5100 



5400 



5460 



TACGTTaAAC GTTTTGAGTG GGTTTATTAA ATGCACGCTT ATAAAAAGTA ATGATGATTA 5520 



5544 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 111: 
AAAAGATTGC AAATATAAAT GGCATGTTTA ATATGTTAGA ACAACAAATC ATTCATAGCC 60 
40 AAGATATGGC TCATTTTAGA AGTGAATTTT TTTACGTCAA TCATGaGCAT CGAGAAAACT 120 



ATGAAgCACT CCTAATTTAT TACAAAAATA GTATCGACAA TCCTATTGTA GATGGTGCAT 180 

GTTATATTTT AGCCCTACCT GAAATTTTCA ATAGTGTTGA T G TTT T CGAA TCAGAGTTAC 24 0 

CATTTTCATG GGTATATGAT GAAAATGGCA TTACCGAAAC AATGAAATCA CTTAGCATTC 300 

CATTACAATA TTTAGTTGCA GCAGCTTTAG AAGTAACTGA TGTGAATATA TTTAAGCCTT 360 

CAGGATTTAC AATGGGAATG AATAATTGGA ATATTGCTCA AATGCGAATC TTTTGGCAAT 4 20 

ATACAGCAAT TATTAGAAAA GAAGCACTAT AACATTAATA ATTAATTAGC TATAAAGATG 4 80 

ATTCACAACA ATCATCTTTA TAGCTTTTTT ATGTCTAATT ATTTTTGAGG AAAATtnACAA 540 
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AATTTTATOT TTTCAAAAGT AAACAATCAA AAGATGTTAG AAGATTGCTT CTATATAAGA 660 

AAGAAAGTGT TTGTAGAAGA ACAAGGCGTC CCTGAGGAAA GTGAAATTGA TGAATATGAA 720 

5 TCTGAATCTA TTCACCTCAT TGGATATGAT AATGGACAGC CAGTTGCCAC TGCTCGAATA 780 

CGCCCTATTA ATGAAACAAC TGTCAAAATA GAACGAGTAG CTGTGATGAA ATCACATCGT 840 

GGACAAGGAA TGGGTAGAAT GCTTATGCAA GCTGTAGAAT CATTAGCTAA AGATGAAGGT 900 

10 

TTTTACGTAG CTACTATGAA TGCCCAATGT CATGCTATCC CATTTTATGA AAGTTTAAAC 96 0 

TTTAAAATGA GAGGTAATAT ATTT CT TGAG GAAGGCATCG AG CAT ATTGA AATGACAAAA X020 

AAGTTAACCT CGCTTAATTA AAAAAAGTTG TATCTATTTT AGAAACA 1067 

15 - 

(2) INFORMATION FOR SEQ ID NO: X12: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 18613 base pairs 
20 <B) TYPE: nucleic acid 

<C> STRANDEDNESS : double 
<D) TOPOLOGY: linear 

25 . <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 112: 

AAGACGtAtG ATAACAACAA TACgTGTAGT GAAAGATTTT AATCTACATA TTACTGACAA 60 

AGAATTCATT GTATTTGTTG GACCATCGGG ATGTGGTAAA TCAACAACAT TACGAATGGT 120 

30 

TGCTGGACTA GAGTCTATCA CAT CTGG AG A TTTTTATATT GATGGGGAAC GCATGAACGA 180 

TGTTGAACCA AAGAATAGAG ATATTGCGAT GGTATTTCAA AACTATG CAT TATATCCACA 240 

TATGACTGTT TTTGAAAATA TGGCATTTGG GCTAAAGCTA CGTAAAGTAA ATAAAAAAGA 300 

35 

GATTGAACAA AAAGTTAATG AAGCAGCTGA AATATTAGGA TTAACTGAGT ATCTTGGTCG 360 

TAAACCAAAA GCGTTATCTG GCGGACAGCG TCAACGTGTT GCTTTGGGCA GAGCTATTGT 420 

40 TAGGGATGCG AAAGTCTTTT TAATGGATGA ACCATTATCG AATCTTGATG CGAAyTtCGA 480 

GTACAAATGC GCACAGAAAT ATTGAAATTA CATAAGCGAC TTAATACTAC GACAATTTAT 54 0 

GTTACACATG ATCAAACTGA AGCATTGACG ATGGCTAGTC GAATTGTTGT TTTGAAAGAT 600 

45 GG CG ACATT A TGCAAGTCGG CACACCTAGA GAAATATATG ATGCCCCTAA TTGCATATTT 660 

GTGGCGCAAT TTATCGGCTC ACCAGCAATG AATATGTTGA ATGCTACAGT TGAAATGGAC 720 

GGATTGAAGG TAGGAACACA CCATTTTAAA TTACATAATA AAAAATTTGA AAAGTTAAAA 7 80 

50 

GCTGCTGGCT ACTTAGACAA GGAAATTATT TTAGGTATTC GAGCTGAAGA CATTCATGAA 84 0 

GAACCAATAT TTATTCAAAC TTCTCCAGAG ACACAATTTG AATCTGAAGT AGTTGTATCC 900 

55 
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AAATTAGATT CAAGAACTCA AGTGATGGCG AACGACAAGA TTACACTAGC ATTTGATATG 1020 

AATAAGTGTC ACTTTTTTGA TGAAAAAACA GGAAATCGTA TCGTCTAAGG GGGAGTATTC 1080 

ATGTCTAAAA TTTTAAAATG TATCACGTTA GCCGTGGTAA TGTTATTAAT CGTAACTGCA 114 0 

TGTGGCCCTA ATCGTTCGAA AGAAGATATT GATAAAGCAT TGAATAAAGA TAATTCTAAA 1200 

GACAAGCCTA ACCAACTTAC GATGTGGGTG GATGGCGACA AGCAAATGGC GTTTTATAAA 1260 

AAAATTACGG ATCAATATAC TAAAAAAACT GGCATCAAAG TAAAGCTTGT AAATATTGGT 13 20 

CAAAATGATC AACTAGAAAA TATTTCGCTA GACGCTCCTG CAGGAAAAGG TCCAGATATC 13 80 

TTTTTCTTAG CACATGATAA TACTGGAAGT GCCTATCTAC AAGGCTTAGC TGCTGAAATC 1440 

AAATTATCAA AAGATGAGTT GAAAGGTTTC AATArGCAAG CACTTAAAGC GATGAATTAT 1500 

GACAATAAGC AACTAGCATT GCCAGCTATC GTTGAAACAA CCGCACTTTT TTATAATAAA 1560 

20 AAATTAGTGA AAAATGCACC GCAAACGTTA GAAGAAGTTG AAGCTAATGC TGCCAAACTA 1620 

ACTGATAGTA AAAAGAAACA ATACGGTATG TTATTTGATG CTAAAAATTT CTATTTTAAT 1680 

TATCCGTTTT TATTCGGCAA TGATGATTAT ATTTTCAAGA AAAATGGCAG TGAATATGAT 174 0 

ATTCATCAGC TAGGACTAAA TTCAAAACAT GTCGTCAAGA ATGCTGAACG ATTACAAAAA 1800 

TGGTACGACA AAGGGTATCT TCCTAAGGCA GCAACACATG ATGTCATGAT TGGTCTTTTT 1860 

AAAGAAGGAA AAGTAGGACA ATTTGTCACT GGACCGTGGA ACATTAATGA ATATCAAGAA 1920 

ACGTTTGGTA AAGATTTAGG AGTAACAACA TTACCTACAG ATGGTGGCAA ACCTATGAAA 1980 

CCATTTCTAG GTGTACGTGG TTGGTATTTA TCTGAATATA GTAAACATAA GTATTGGGCT 2040 

AAAGATTTAA TGCTGTATAT CACTAGTAAA GATACATTAC AAAAATATAC AGATGAAATG 2100 

AGCGAAATTA CTGGACGTGT TGACGTGAAA TCATCTAATC CAAATTTAAA AGTGTTTGAA 2160 

AAGCAAGCAC GTCATGCTGA ACCGATGCCT AATATTCCTG AAATGCGACA AGTTTGGGAA 2220 

40 CCGATGGGCA ATGCAAGCAT ATTTATTTCA AATGGTAAGA ATCCTAAACA AGCGTTAGAT 2280 
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30 



35 



GAGGCGACGA ATGATATAAC GCAAAATATT AAGATTCTTC ATCCATCACA AAATGATAAG 2340 

AAAGGAGATT AGTTATGACG AAACGTAACC CTAAATTAGC GGCATTATTA TCTGTTATAC 24 00 

45 CTGGTTTGGG ACAGTTTTAT AATAAAAGAC CCATTAAAGG GACGATATTT TTTATCTTTT 2460 

TCATCAGTTT TATTTCTGTT TTTTATAGCT TTTTAAATAT TGGTTTTTGG GGATTGTTCA 2520 

CATTAGGGAC AGTACCTAAG TTAGACGATT CTCGTGTCTT ACTTGCACAA GGTATTATTT 2580 

50 

CTATCTTACT CGTTGCTTTC GCAATCATGC TATATATCAT TAATATTTTA GATGCATATC 264 0 

GTAATGCTGA ACGATTTAAT CGCAATGAGG AAATAAAGGA TCCGAAGcGC GTATGGTGGC 2700 
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TGTAGTTGTA TTTCCATTAA TAyyTATGTT TGGAGTAGCA TTTACAAATT ACAATTTATA 
CAACGCGCCT CCGAGACACA CATTAGAATG GGTTGGTTTA GATAACTTTA AAACGTTATT 
CACAATTGGC GTTTGGCGTA AAACATTTTT CAGTGTTATT ACTTGGACAT TAGTATGGAC 
GCTTGTTGCA ACGACACTTC AAATTGCATT AGGGCTGTTT TTGGCAATTA TTGTAAATCA 
CCCTGTCGTC AAAGGTAAGA AATTTATCCG TACTGTGTTA ATCCTACCTT GGGCTGTACC 
ATCATTTGTG ACAATTTTAA TATTTGTAGC GTTATTTAAT GATGAATTTG GTGCGATAAA 
TAATGATATT TTGCAACCTT TATTAGGTGT AGCACCAGCA TGGTTAAGTG ATCCGTTTTG 
GG CAAAAGTG GCATTAATCG GCATTCAAGT ATGGCTTGGA TTCCCATTTG TCTTTGCACT 
GTTCACTGGA GTACTGCAAA GTATTTCATC AGATTGGTAC GAAGCAGCAG ATATGGATGG 
TGCGTCTAGT TGGCAAAAGT TTAGAAACAT CACATTCCCG CATGTCATTT ACGCCACAGC 
G CCATTGTT A ATT ATG CAAT ATGCAGGTAA TTTCAATAAT TTTAATCTTA TTTATCTATT 
TAATAAAGGC GGTCCACCAG TGTCAGGGCA GAATGCTGGT AGTACAGATA TCTTGATATC 
TTGGGTGTAT AATCTGACAT TTGAGTTTAA CAACTTCAAC ATGGGTGCAG TTGTGTCATT 
AATTATTGGA TTTATTGTTG CTATTGTCGC ATTTATTCAA TTCAGACGTA CAAGTACGTT 
TAAAGATGAG GGAGGTTTAT AAGATGACAA AGAAGAAAAA CATATTAAAA GCAATCGGTA 
TTTACAGTTT TATAGCGATG ATGTTTGTCA TCATTTTATA TCCACTACTG TGGACATTTG 
GCATTTCCCT TAATCCAGGT ACGAACTTGT ATGGTGCCAA AATGATACCA GACAATGCAA 
CATTTAAAAA TTATGCATTC TTACTATTCG ATGACAGTAG TCAATACCTG ACTTGGTATA 
AAAATACGCT TAT CGTAGCA TCTGCAAATG CACTGTTTAG TGTGATATTT GTCACGTTAA 
CAGCATATGC TTTTTCTAGA TATCGCTTTG TTGGTCGTAA ATACGGGCTG ATTACATTTT 
TGATCTTACA AATGTTCCCT GTATTAATGG CAATGGTCGC AATCTATATT TTGCTAAATA 
CAATTGGATT ATTAGATTCT TTATTTGGAC TAACACTGGT ATATATTGGT GGATCAATAC 
CGATGAATGC CTTTTTAGTG AAAGGTTACT TCGATACGAT TCCAAAAGAA CTTGATGAAT 
CTGCCAAAAT TGATGGTGCA GGGCATATGC GTATTTTCTT ACAAATTATG CTTCCATTAG 
CTAAGCCGAT TTTAGCAGTT GTTGCTTTGT TCAATTTTAT GGGGCCATTT ATGGACTTTA 
TATTACCTAA AATACTATTA AGAAGTCCTG AAAAATTCAC ATTAGCAGTT GGATTGTTCA 
ACTTTATTAA TGATAAGTAT GCAAATAATT TCACAGTGTT TGCAGCAGGG GCAATTATGA 
TTGCAGTACC TATAGCAATC GTATTCTTGT TCTTGCAACG CTATTTAGTA TCAGGTTTAA 
CAACAGGTGC GACAAAAGGT TAGTTTGAAA TTAGGAGTGG GGCAGAATTG ATAAAGAACC 
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GGGTGTGGTG GTATTGCGAA TGGCAAGCAC ATGCCAAGTT TACAAAAAGT TGAAAATGTT 4 620 

GAAATGATCG CATTTTGTGA CGTAGACATT TCGAAAGCAG CGAGTGCGGC AGAAGCATAC 4680 

GGAACTGACA ATGCAAAGGT TTATGATGAT TACAAAGCAT TGTTAAAAGA TGACACGATT 4740 

GATGTTATCC ATGTTTGTAC GCCAAATGAC TCGCATTGTG AAATTACTGT AG CAGGGTTG 4800 

CATGCTGGTA AACATGTGAT GTGTGAAAAA CCAATGGCTA AAACGACAGC AGAAGCTCAA 4 860 

AAAATGATAG ATACAGCTAA ATCAACAGGT AAAAAATTAA CAATAGGTTA TCAAAATCGT 4 920 

TTCCGAGCAG ATAGTCAATT TTTACATCAA GCAGCGCAAC GTGGCGACTT AGGAGACATT 4 980 

TACTTCGGAA AGGCACATGC CATTCGTCGT CGAGCAGTAC CAACATGGGG TGTCTTTCTA 504 0 

GACGAAGAAG CTCAAGGTGG AGGACCATTA ATCGATATCG GTACACACGC TTTAGATTTA 5100 

ACGTTATGGA TGATGGATAA TTATGAACCA GAATCAGTGA TGGGTTCAAC ATTCCATAAA 5160 

20 TTAAATAAAC AGCATCATGC GGCAAACGCT TGGGGTTCAT GGAATCCAGA TGAATTTACA 5220 

GTTGAAGATT CTGCGTTTGG ATTTATTAAA ATGAAGAATG GAGCGACGAT CATTTTAGAA 52 80 

TCCGCTTGGG CGATTAATTC TTTAGAAGTG GATGAGGCAA AATGTTCATT ATCAGGAACT 534 0 

AAAGCAGGTG CTGATATGAA AGATGGTCTA CGTATTCATG GTGAAGACAT GGGTACACTT 54 00 

TAT AC CAAAC ACGTTGAATT GGAAAACAAA GGCGTCGACT TTTATGAAGG TAATGAAGTG 54 60 

GATGAAGCTG AAGAAGAAGC AAAAGCTTGG ATTGATGCAG TTGTAAATGA TACTGAACCA 5520 

GTTGTGAAAC CGGAACAAGC AATGGTAGTT ACAAAAATTC TTGAAGCGAT TTATCAGTCT 5580 

GCAAAATCAG GCAAAGCAAT TTACTTTGAA TAACATCATA CGGTAAGGAG GCACATCATG 5640 

ACAAAATTAA AAGTTGGTGT GATAGGTGTT GGTGGTATTG CACAAGACCG TCATATTCCA 5700 

GCATTGCTGA AACTCAAAGA CACAGTCTCA TTAGTTGCAG TACAAGATAT TAATACAGTG 5760 

CAGATGATTG ATGTTGCGAA gCGCTTTAAT ATACCTCATG CAGTTGAGAC ACCTAGCGAG 5820 

40 CTGTTTAAAC TTGTTGATGC GGTGGTCATT TGTACACCTA ATAAATTCCA TGCTGATCTT 5880 
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TCTATAGAAG CATTGAACCA TGGTGTCCAT GTATTGTGTG AAAAGCCAAT GGCGATGACG 5940 

ACGGAAGAGT GTGATCG CAT GATTGAAGCG GCTAATAAAA ATCACAAATT ATTAACTGTC 6000 

45 GCATATCATT ATCGTCACAC AGATGTGGCA ATTACTGCTA AAAAAGCAAT TGAATCAGGT 6 060 

GTGGTTGGTA AACCTTTAGT AGCACGTGTA CAAGCGATGC GTAGGCGTAA AGTGCCTGGC 6120 

TGGGGTGTTT TTACCAATAA AGCGTTGCAA GGTGGCGGTA GTTTAATCGA TTATGGTTGC 6180 

SO 

CACTTGTTAG ACTTATCTTT GTGGCTACTA GGTAAAGATA TGGTGCCGCA TGAAGTGCTA 6 2 40 

GGAAAAACAT ATAATCAATT GAGCAAACAA CCGAATCAAA TTAATGATTG GGGAACATTT 6 3 00 
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GCAAGCATGC AGTTTGAATG TTCGTGGTCT 
AGTTTATCAG GAGAAGATGG CGGTATCAAT 
5 TTTGGAACTA TTTTTGAAAG CAAAGCTAAT 

AGACAGGCGC GTAACTTTGT CAATGCGTGT 
GAAGAAGCAC GCAATGTAAA TGCCCTTATA 

10 

AAGAG CAT AC AACTTTAATG ATTATCATAT 
GAGTGCTTTT CAATGAAAAT AGGTGTATTT 

15 GATATGTTAG ATTATGTCTC AGAATCTGGA 

AACCCAGGAG ATAAATTTTG TAAGTTAGAT 
GCATTTATGA AGTCAATCAC AGACAGAGGC 

20 AATCCAATTT CTCCAGATCC GATAGAAGCG 

ATCCGTTTAG CAAATCTATT AGACGTGCCA 
TCAGATGATA CCGCTAAAAA GCCTAATTGG 

25 GAAATTTATG ATTATCAGTG GAATGAAAAG 

TTTGCAAAAG AGCAAGATGT AAAAATTGCC 
ACACCATATA CAATGTTGAA GTTACGTGAG 

30 

GATCCTAGTC ATCTATGGTG GCAAGGTATT 
CAAGCAAATG CAATTCATCA CTTCCATGCT 
AATATGTATG GTCTAACTGA TATGCAACCA 

35 

TTCCGTACAG TTGGTTATGG ACATAGTCCA 
ATTATTAATG GATATGATTA TGTATTAAGT 

40 GAAGAAGGTT TCCAAAAAGC TTGTCAAACT 

GCAGACATGT GGTGGGCATA ATACGAACTC 
ACTGGTGGCA GTGTTGAATA AATGCATATG 

45 TTAAATCAAG TCATTGTTTG TAAAGAAGGT 

TACCCATTCA CAGTAACAAT CCTCACCATT 
GGTATATGAT AATAAAAAAA GCCTGTTGTC 

SO 

GGTTTCTGAA TATAATATTT CAGAATGCAC 
TGATGACAGG CTTTCATCTT TTTAAATATT 

55 



>0 786 519 A2 

GCAAATATCA AAGAAGATAA GGTTCACGTT 64 20 

TTATTTCCAT TTGAAATATA TGAGCCCCGC 64 80 

GTTGAGCATA ACGAAGACAT TGCTGGTGAG 6540 

TTAGGGATAG AAGAGATTGT GGTGAAACCG 66 00 

GAAGCGATTT ATCGTAGCGA TCTTGATAAC 66 60 

ATGATACAAA ATTCTCAATA TAAAAAGAAG 6720 

TCAGTATTAT TTTACGATAA AAATTTTGAA 67 80 

TTGGATATGA TTGAAGTTGG AACAGGTGGT 684 0 

GAGTTGTTAG AAAATGAAGA CAAGCGCCAA 6900 

TTACAAATAA GTGGTTTCAG TTGTCATAAC 6 960 

AAAGAAGCCG ATGAAACGTT ACGTAAAACA 7020 

GTTGTTAATA CATTTTCTGG CATTGCAGGA 7080 

CCTGTTACAC CTTGGCCAAC AGCCTACTCT 714 0 

TTG ATAC CAT ATTGGCAAGA TTTAGCTGAG 7200 

ATAGAGTTGC ATGCAGGATT TTTAGTG CAT 726 0 

GCTACAAATG AATATATCGG TGCTAACTTA 7320 

GACCCAATTG CTGCGATTCG CATATTAGGC 73 80 

AAAGATACGT ATATTAATCA AGAAAATGTA 744 0 

TATGGTAACG TTGCGACAAG AGCATGGACA 7500 

TATGTATGGG CAGATATCAT AAGTCAACTT 7560 

ATTGAACATG AAGATC CT AT TATGTCAGTA 7620 

TTGAAATCTG TTAATATTTA CGACAAGCCA 7680 

GAGGTTAGTC TGAAGTTTGT CTGAAGTAAG 774 0 

TCGCCAAGCC ATTGCCAAAA ATTTCACACC 7800 

GTACTTTATA TAAGTATATA GCGATGGTCA 7860 

GAAAAGAGTA TATAAC CTTT TCAATAGTGA 7 920 

ACAATGGTCA TAGACACGAC ATACTTTAAA 7980 

TTTAAAGATG GACGTCGATG TAGACTAAAG 804 0 

CATTAATTTC TCTTCTTGTT TAATACGTAC 8100 
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TAATACACCG 
ATATAATCCA 
ACCACCTAAA 
GCCAATACCA 
TACATAAATT 
TGCACCGTCT 
GATACAGAAA 
TGTATAAGCG 
TTAACTATTT 
TTTTGGATAA 
CTTAACGAAA 
CAAAGGCATT 
CTTCGTAGTG 
ACAACCGTTT 
AGCATTTAGT 
TAACACAAAA 
GGGATTTGTT 
TAACGGGGTG 
GCCAAGAACG 
TGC CATAGCA 
AGGGATGTTC 
CGGAAAAGAT 



SO 



GGTCGATAAA 
TATCCTGGGA 
ACGAATCGGT 
AGGCGATGCA 
ATGGGGCTAC 
GTTTATGATT 
CATTTCATTG 



ATTAATTCAG GAATGATGTT TAAGAAGTAA TTTGGGTGTT TTGTA A TTTT 
GATTTAATAA TAGGATGGTT AGGTAAAATG AATAATTTTA ATGTCCAAAT 
GTTTTAATAA CCATAAATAA CATGATATAA GCAAAGATTA ATATAACTAA 
TTTGCAAAGC TAAATGTATC TTTATTAATA AATG CCTCTA CACCAGCCAA 
AAAACGTGTG TTATTGCTAA AAACTTCGAA TTTTTAACGC CATATTCAAC 
GCTTTTAATT GTTTTGAGTG ATTAATAGAT ATCTTTAAGC TGACAAGTCT 
AAGATAAGTA ATATAGATAG AAT CATGATG TCCTCCGTCA TTATGTCATA 
TTGATTTTGA CAACATAAAG TATTTTATAG ATAAAGCTTG TCAAATACTA 
ATTAATTTTA GTACATAAAT ATGTTTCTAA GTATGTGTTT ATGTTCAGTA 
TTTAATAATT TTAAGGATAT TAAGCGCTTA CACCGACGTG ATATATTTGG 
ATGATTGAGG TGACAGAGAT GAACTTTTTT GATATCCATA AGATTCCGAA 
CCATTATCGG TACAACGTAA ATTATGGCTT AGAAACTTCA TGCAAGCTTT 
TTCTTTGTTT ATATGGCTAT GTATTTAATT CGAAACAACT TTAAGGCGGC 
TTAAAAGAGG AAATTGGATT ATCTACATTA GAACTTGGTT ATATCGGATT 
ATCACGTACG GTTTAGGAAA AACATTACTT GGATATTTTG TCGATGGACG 
CGTATTATCT CGTTCTTACT TATCTTATCT GCGATTACAG TTTTAATTAT 
TTAAGTTACT TTGGTTCTGT AATGGGATTA TTAATTGTAC TTTGGGGACT 
TTCCAATCAG TTGGTGGACC TGCAAGTTAT TCAACGATTT CAAGATGGGC 
AAACGTGGCC GATACTTAGG ATTCTGGAAT ACATCACATA ATATCGGTGG 
GGTGGTGTTG CACTTTGGGG TGCTAATGTA TTCTTCCATG GAAATGTTAT 
ATTTTCCCAT CGGTGATTGC ATTACTTATT GGTATCGCAA CATTATTTAT 
GATCCGGAAG AATTAGGATG GAATCGTGCT GAAGAAATTT GGGAAGAGCC 
GAAAATATTG ATTCTCAAGG TATGACGAAA TGGGAGATCT TTAAAAAATA 
AATCCTGTTA TATGGATTCT ATGTGTTTCA AACGTCTTTG TATACATTGT 
ATTGATAACT GGGCACCGTT ATATGTGTCA GAGCATTTAC ACTTTAGTAA 
GTTAATACGA TATTCTACTT TGAAATTGGT GCATTAGTTG CAAGTTTATT 
GTATCAGACT TATTAAAAGG TCGTCGTGCA ATTGTAGCTA TTGGCTGTAT 
ACATTTGTTG TCTTATTCTA CACAAATGCT ACAAGTGTCA TGATGGTTAA 
TTTGCATTAG GTGCGTTAAT CTTTGGTCCG CAATTATTAA TTGGTGTATC 
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GTAACGTAAC ATTTGCGATA ATTGTTGGAC CACAGTTtGT GCTAATTTCG GAGATAACGT 
AATTAAATAT TGTATTGTTT GCATCGTATT GAATAGGAAA TGAGGCTGGA ATTGGCGTTC 
TATTTCCTTT AACTGAATAT CACGCAAGCG ACGTTCTGTA TGCTCGATAG AATGGATCAG 

TTGCTCATTT GATTCAAATA AATCGTAAAT ATAATTATTA ATTTCTTCTA GTTCACTGTT 12 000 

GTTTTTTAAA GGCGTATATG TACCTAGATG ACGATTTTTG GCATAGTAAA TTTTTTGAAT 12 060 

AATCGTTTCG ATATCTTTTG TTTGTCGTTT AGCCATATTA TCTGCGCTAA TGAAACCAAA 12120 

TATTACTAGT AAAACAAGAA CTACGGCCAT AACAATTAAC AACGTGATAC CATCTTCAAT 12180 

GTTTTCATGT ATATCTTTAT AAATAATGAG ACGATGGTCA GCATGGTTTA ATTTTACAGA 1224 0 

TTCATTCATA AATCCGAATT GTTGTGGTcT ATACTTTTCA C CTATAGTAA AACGGTCATC 12300 

GTTGGCGTAT AAAATATTGT CATATTGATC AmCGATAAGT GCGAATTGTC GGTTATCTTT 12360 

20 C t TAATTTCA CTTAAACGTG GGGTGTtAGC CATATAAATt TTaAGCATAT ATGTACTATT 12420 

TTTGAATTTA AGCTGATGCG TTGAAAATAA ATACATATTT TTAGTGTTTA AATGTTCATA 124 80 

ATTATTGGTT ATAAACTGAT TTGGTCCAGA TAATTCATAA TAAAGTGTTG CGGGCTGTTG 12540 

25 GkGTATTAAT TTTAATAATT CACGTTTTGT AGCGGTCACA TCATGATGAT TTGyTAAATC 12600 

GAGCTCTTGA AACGAATTAT TATGCTGTGT AATAAATGTC TGAATCTGCT TTTCAGTATG 12660 

ATGTAAAGAT GACTGACTTT CATCAACATG TTGATGAATC GTACGATGCT CAATCCAAAT 12 720 

ATAGATGGCA TAGAAGCTTA CTAGTCCAAT AATAATGACT AAAAATACTG GAAAAATAGT 12 780 

AGACnCAAAT AACGATCGTC TTAATTGATG TCTATAAGGT TTGTATGCCn TCATTGAATC 12840 

ATCTCCAAAA ATTTATGATG TGGAATATCC GGTAATTTAG ATTTCGGTAT TAAAGGTATG 12 900 

TTCTTAAGAT TTTCGATAGA CTGATCGCTT TGTTCACTAA CATCCTTTCG AATTGACTTG 12960 

GCATCGAACT CTGCAACTAA TCGTtGTTGT ACTGAGCGGC TTGTTAAATA TTGCACTAAC 13020 

TTTTTACGCT TAGGATGAGG GTGTGCATTT TTAACTAAAG CAATrCCATC AACATTTAAC 13 080 

40 



ATTGTTCCTT CAATTGGATA AACGATTGAT ACAGGATAAC CTTTGTTTTT CCATGTGCGT 13140 

GCATCTTGTT CGTAGCTTAG ACCTGCGTAA TATTTACCTT TTGCAACATC TTCAATGACT 13200 

45 TTAGAGGTCT TTGACAGTTG CATCGCATGG TTTTGGAATT GATGCACATC ACTTACTCGA 13260 

TGATGCATGC TATAAATAGC ACGCATATGT TGATAGCCTG TCGTTGTTGT ATTTGGATTT 13320 

GAGTACGCAA TTTTACCTTT AAGTATAGGT TGTAATAAAT CTTGATAACC TCGAATCTTA 133 80 

50 AT AT CTCCTT GTAAATCTGA ATTCACTACT ATAACTGTTG GCATTAATAG AAAACTAGTA 13440 

ACATATTTAT TGTTCGAGCG ATAATCCTCT AATTGCTGTG TTACAGATGT ATCTTGATAG 13 500 
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CCACGCTCCG AAAAATCTTC GTTATGCAAG TTTGAAAGCA GTACTTGAGT AGATCCGTGT 13620 

TTAATTTCAA TTTTGACATG CTCTTGTTTT TCAAATTCAT TTAAAATTGG ACGAATCAAG 136 80 

TTTGATTGAT ACGGAGAATA AACTGTTAAT ACATTTTTAT CGGATTCAGA GTGACGCGTA 13740 

TTAGCGCATG CTGaTAAAAA AATGAGAAAT AATAGCAAGA TATAAATTTT TGATTTCATG 13 800 

ATATCCCATC AATTCTATGT ATATTTTAAT ACAATAATTT TAG CAAT AAA TGACGCATAA 13 860 

GTAATGTTAA ATATTTAGAA ATGTTTATAG ATGACTTGTT AAGACGTTGC AAATGTTGTG 13920 

ATAGCACAAA ATTTTTGTTT GTCAAGACGA TTTACCGAGG CTGTAAAATC AAACTGTTAT 13 980 

ATTTTATTTG TAG CTGTT AT ATAAAAATCG GCAAGATATT GAACGGTTCA AAAGTGAATT 14040 

TTTACGTCAA TAAAAGTATT TAATCCAGTC TCTTCATATA TAAAAGTAAA TCTTTCTAAG 14100 

TGTTGATTTA ACGCTTATCA ACAATCATTT TTTATAAACA AATATATACT CCTAAATTAA 14160 

20 CTTTTAAAGC AATGAAAATA GTGAACATTA TAACTGTTGT GTAACAGAAT GCAATTAGCA 14220 

TATT A CTGTT ACACAAATTA GTACAGTTTC TATGTTTTGA CATACATTTG ATGAAAATTG 14 280 

TACATAATTT ATGTGAAAAA AATCACAACA AACATGCTAC AATGACTATG AAAA CGTTAA 14 340 

CATAGCATTT CAAATTCACA ACATTATACA GATGGAGGCG TTTAGTATGT TAGAAACAAA 144 00 

TaAAAATCAT GCAACAGCTT GGCAAGGATT TAAAAATGGA AGATGGAACA GACACGTAGA 144 60 

TGTAAGAGAG TTTATCCAAT TAAACTACAC TCTTTATGAA GGTAATGATT CATTTTTAGC 14 520 

AGGACCAACA GAAGCAACTT CTAAACTTTG GGAACAAGTA ATG CAGTTAT CGAAAGAAGA . 14580 

ACGTGAACGT GGCGGCATGT GGGATATGGA CACGAAAGTA GCTTCAACAA TCACATCTCA 1464 0 

TGATGCTGGT TATTTAGACA AAGATTTAGA AACAATTGTA GGTGTACAAA CTGAAAAGCC 14700 

ATTCAAACGT TCAATGCAAC CATTCGGTGG TATTCGTATG GCGAAAgcAG CTTGTGAAGC 14760 

TTACGGTTAC GAATTAGACG AAGAAACTGA AAAAATCTTT ACAGATTATC GTAAAACACA 14 820 

40 TAACCAAGGT GTATTCGATG CATATTCTAG AGAAATGTTG AACTGCCGTA AAGCAGGTGT 14 880 

AATCACTGGT TTACCTGATG CATACGGACG TGGACGTATT ATCGGTGACT ATCGTCGTGT 1494 0 

AGCTTTATAT GGTGTAGATT TCTTAATGGA AGAAAAAATG CACGACTTCA ACACGATGTC 15000 

45 TACAGAAATG TCAGAAGATG TAATTCGTTT ACGTGaAGAA TTATCAGAAC AATATCGTGC 15060 

ATTAAAAGAA TTAAAAGAAC TTGGACAAAA ATATGGTTTC GATTTAAGCC GTCCAGCAGA 15120 

AAACTTCAAA GAAGCAGTTC AATGGTTATA CTTAGCATAC CTTGCTGCAA TTAAAGAACA 15180 

SO 

AAACGGTGCA GCAATGAGTT TAGGTCGTAC ATCAACATTC TTAGATATCT ATGCTGAACG 15240 

TGACCTTAAA GCAGGC G TT A TTACTGAAAG CGAAGTTCAA GAAATTATTG ACCACTTCAT 15300 
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AGACCCAACT TGGGTAACTG AATCTATCGG TGGTGTAGGT ATTGACGGAC GTCCACTTGT 15420 

TACGAAAAAC TCATTCCGTT TCTTACACTC ATTAGATAAC TTAGGTCCAG CTCCAGAACC 15480 

AAACTTAACA GTATTATGGT CAGTACGTTT ACCTGACAAC TTCAAAACAT ACTGTGCAAA 15540 

AATGAGTATT AAAACAAGTT CTATCCAATA TGAAAATGAT GACATTATGC GTGAAAGCTA 15600 

TGGCGATGAC TATGGTATCG CATGTTGTGT ATCAGCGATG ACAATTGGTA AACAAATGCA 15660 

ATTCTTCGGT GCACGTGCGA ACTTAGCTAA AACATTACTT TACGCTATCA ATGGTGGTAA 15720 

AGATGAAAAA TCTGGTGCAC AAGTTGGTCC AAACTTCGAA GGTATTAACA GCGAAGTATT 1578 0 

AGAATATGAC GAAgTATTCA AGAAATTTGA TCAAATGATG GATTGGCTAG CAGGTGTTTA 15840 

CATTAACTCA TTAAATGTTA TTCACTACAT GCACGATAAA TACAGCTATG AACGTATTGA 15900 

AATGGCATTA CATGATACAG AAATTGTACG TACAATGGCA ACAGGTATCG CTGGTTTATC 15960 

20 AGTAGCAGCT GACTCATTAT CTGCAATTAA ATATGCACAA GTTAAACCAA TTCGTAACGA 16020 

AGAAGGTCTT GTAGTAGACT TTGAAATCGA AGGCGACTTC CCTAAATACG GTAACAATGA 16080 

CGACCGTGTA GATGATATTG CAGTTGATTT AGTAGAACGC TTCATGACTA AATTACGTAG 1614 0 

25 TCATAAAACA TAT CGTGATT CAGAACATAC AATGAGTGTA TTAACABTTA CTTCAAACGT 16200 

TGTATACGGT AAGAAAACTG GTAACACACC AGACGGACGT AAAGCTGGCG AACCATTTGC 16260 

TCCAGGTGCA AACCCAATGC ATGGCCGTGA CCAAAAAGGT GCATTATCTT CATTAAGTTC 16320 

TGTAGCTAAG ATCCCTTACG ATTGCTGTAA AGATGGTATT TCAAATACAT TCAGTATCGT 16380 

ACCAAAATCA TTAGGTAAAG AACCAGAAGA TCAAAACCGT AACTTAACTA GTATGTTAGA 1644 0 

TGGTTACGCA ATG CAATGTG GTCACCACTT AAATATTAAC GTATTTAACC GTGAAACATT 16500 

AATAGATGCA ATGGAACATC CAGAAGAATA TCCACAGTTA ACAATCCGTG TATCTGGTTA 16560 

CGClSTTAAC TTCATTAAAT TAACACGTGA ACAACAATTA GATGTAATTT CTCGTACATT 16620 

CCATGAAAGT ATGTAACAAA ATTTAAGGTG GGAGCACTAT GCTTAAGGGA CACTTACATT 16680 
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CTGTCGAAAG TTTAGGTACT GTCGATGGAC CGGGATTAAG ATATATATTA TTTACACAAG 16740 

GATGCTTACT TAGATGCTTG TATTG CCACA AT CCAGAT AC TTGGAAAATT AGTGAGCCAT 16800 

45 CAAGAGAAGT CACAGTTGAT GAAATGGTGA ATG AAATATT ACCATACAAA CCATACTTTG 16860 

ATGCATCGGG TGGCGGTGTA ACAGTCAGTG GTGGCGAACC ATTGTTACAA ATGCCATTCT 16920 

TAGAAAAATT ATTTGCAGAA TTAAAAGAAA ATGGTGTGCA CACTTGCTTA GACACATCGG 16 980 

50 CTGGATGTGC TAATGATACA AAAGCATTTC AAAGGCATTT TGAAGAATTA CAAAAACATA 1704 0 

CAGACTTGAT ATTATTAGAT ATAAAACATA TTGATAATGA CAAACATATT AGATTGACAG 17100 
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TATGGATTCG ACATGTCCTT GTGCCTGGTT ATTCTGATGA TAAAGACGAT TTAATTAAAC 17220 

TAGGGGAATT TATTAATTCT CTTGATAACG TCGAAAAGTT TGAAATTCTG C CAT ATCATC 17280 

AGTTAGGTGT TCATAAGTGG AAAACATTGG GCATTGCATA TGAATTAGAA GATGTCGAAG 1734 0 

CGCCCGATGA TGAAGCTGTT AAAGCAGCCT ACCGTTATGT TAACTTCAAA GGGAAAATTC 17400 

CCGTTGAATT ATAAATACAA TTCAGACCGA AAAGAAAGCA TATGCAACTT CAAGAGTGAA 17460 

GGGGCATATG CTTCTTTTTC AATTGAGTAT TGAGTATTAG CAAGACGTAG TAAGTATATG * 17520 

AGACAACTTC TACAATGGTT GAAGGAAGAC GTTTTTGTAA GTAGCTATGC TGATAAAGAA 175 80 

TGTGATGTCT TGTTAAAGGT GGGGTTCCAA TATCATCATT TAGCTGATGT TGAATGGGTT 17640 

ATTATTTGCT ACTTGCATAT GAATATGAGT CTTTTCAAAT TTTTATTGAC CCTGAGTAAT 17700 

GAAAAATATT AAGATGAAAC TTAATATTAA AgCAATGCGG AGCGTGATTA TGAAGAGAAT 17760 

20 TAGTAAAGAT ATATGGGCAG TATTTAAATT ACTGTATCaA AATAAAGGGC GTTTTAGCAT 17820 

TAATGCCTTA CTATTGCAGT TAAT CATGAT TTTTATTAGT AGTACATACT TAATTTTACT 17 880 

ATTTAATATG ATGTTAAAAG TAGCTGGcAA AGCCAACTTA CGATTAACAA TTGGACGGAA 17 94 0 

25 ATCGTTAGTC ATCCCGCCAG TGTGATACTT CTTATTATAT TCATATTAAG TGTTGCCTTT 18000 

CTGATTTATG TAGAGTTTTC ATTGTTAGTT TATATGGTTT ATGCCGGCTT TGATCGACAG 18060 

ATTATTACAT TTAAATC CAT TTTTAAAAAT GCCTTTGTAA ATGTGCGTAA ACTCATAGGT 18120 

GTACCAGTTA TTTTCTTTGT CATTTATTTA ATGTTAATGA TACCCATTGC CAACCTAGGA 18180 

CTAAGTTCAG TATTAACAAA AAATATTTAC ATACCTAAAT TTTTAACGGA AGAACTTATG 18240 

AAAACGACGA AAGGTATAAT CATTTACGGT ACCTTTATGA TTGCTGTATT TATATTAAAT 18300 

TTTAAATTAA TATTTACTCT ACCGTTAACG ATTTTAAACC GCCAGTCGTT ATTTAAAAAT 18360 

ATGAGACTAA GTTGGCAAAT TACGAAGCGA AATAAGTTTC GGCTTGTTAT AGAAATAGTT 18420 

ATATTAGAAC TCATCATTGG TGCGATTTTA ACATTAATTA TTTCAGGAGC AACATATCTT 18480 

GCTATTTGTG TAGATGAAGA AGGAGATAAG TTTTTAGTCT CATCAATTTT ATTTGTTGTA 18540 

TTGAAAAGCG CATTGTTCTT CTATTATkTA TTtACGAAAT TATCATTAAT CAGTGTGTTA 18600 

45 GTACTGCACT TAA 18613 

(2) INFORMATION FOR SEQ ID NO: 113: 

(i) SEQUENCE CHARACTERISTICS: 
50 (A) LENGTH: 1214 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 113: 
AAAGTTTTAA AAGGGGTGAG ATACTTGGCG AAT AAT C CAT TCCAGCTTTG CGTTTAAAAG 
GAATTATACT TGCCATTGTC GGTG CTTGTT TATGGGGATT AGGTGGTACT GTTTCTGATT 
TCTTGTTCAA ATATAAGAAT ATTAATGTCG ATTGGTACGT CACTGCTCGA CTTGTAGTCA 
GTGGTGTTTT CTTACTTATT ATGTACAAAA TGATGCAACC CAAACGTTCA ATATTTAGCG 
TATTCCAAGA TCGACGTATG TTAGGCAAAT TACTTATCTT CAGTATACTG GGCATGTTAG 
TAGTACAATA TGCTTATATG GCATCTATTA ATACAGGTAA TGCTGCGATT GCAACATTAC 
TACAAT A CAT TGCGCCAGTT TATATTATTA TTTGGTTTGT CATAAGAGGC GTTGCAAAAC 
TAACATTATT TGATGTGCTT GCTATTATCA TGACACTATT AGGAACATTT TTATTATTAA 
CAAATGGTTC ATTTTCTAAT TTAGTCGTCA ATCCTGCAAG TTTATTCTGG GGTATTTTAG 
CTGGTGTAGC ACTCGCTTTT TACACAATTT ATCCTTCAGA CCTACTTAAC CGCTTCGGTT 
CGATTCTAAT TGTCGGGTGG GCAATGCTTA TTTCTGGTGT TGCGATGAAT TTACGCCATC 
CAATTTGGCA CATTGATATC ACTAAATGGG ACATATCAAT TATATTATTT TTAATCTTTG 
GTATTATCGG TGGTACCGCA CTCGCATTTT ATTTCTTTAT CGACAGTTTA CAATACATAT 
CAGCGAAAGA AACAACATTA TTCGGAACTG TTGAACCTGT CGTAGCCGTT ATCGCAAGCA 
GTCTATGGTT ACATGTGGCA TTCAAACCAT TTCAAATCGT AGGCATCATT CTTATTATGA 
TTTTAATTTT ATTACTATCA CTTAAAAGAC AACCTGAAAC ATTAGATGAA TAAGAAAACT 
CTGATAATCA CTTTAGCAAG TAACTATTAT TTAACAACGT AGTTACCTTA TAGGTGATAT 
CAGAGTTTTT TATTTTAGTT AATAATATTT TTCACTTGGT ATAAAAAaGC GTCGTCGCTC 
TGGTAATCGG AAATACTGGA ATAAAATATG GAATTGGGTA ATAATC CCAG GTAnTAAAAG 
TCCAJGTTCC GATAnCCTnT CCGCAnCTCC AACCAAATTT GCCGATAAGG TTCCAAAAGG 
CATCCTGGGG GTAC 

(2) INFORMATION FOR SEQ ID NO: 114: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9458 base pairs 

(B) TYPE: nucleic acid 
<C> STRANDEDNESS : double 
(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 114: 
ATTTTGGTTT CATTCACGAT GGGGTnATAC AGCAAACACA nCTAAAATAA CT ATCAAT AG 
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CTTAGACAAT AAAAAATATG CCACTACAAT 
AACGATTACT TTCATCGTTG TTCTATCTCT 
5 TGATAATGAA ACAGCAAAAA AAGTAATAGC 

TAAACCTATG ACTAATAATG TATTAGAAAT 
AATATGCACT CACCCTTTTT ATTTAAATAA 

10 

CATAGGCCTG TCGATGATTG ATTCACAATA 
TCATTTATTC CATCAAAAAC ACCCTTTTTA 
ACACTGCTTG CATGTAGAAA CACTTTTTCA 

75 

TTTAGCATAT TAAGCATGTA TGTTAAACTA 
AATAGACTTC TTATAGTTGT CTTAGCATTT 

20 TTATTAACTT TATTTAGGAA GTCGCTTAAA 

ACCATTGAAG CCATATTAGA TAATAGCCCT 
AATTTATTTA TGATGACTTG ACGTCCTCGA 

25 GCATCATCTA ATGTTTTAAT AAGCTTGATT 

ATTGCCTCTG TAACTTCATT TAAACTTTCT 

CGTCTAATTT TAGAAGATAT TCTCTCAGCC 

30 

CATAATCTGA ACGTTCCCAT TTTTTCTGTA 

TATTGACACG GAAATTATTA GGGTTCAACG 

AACGACAGCT AGTACGTTTA TAAGATGGTG 

35 

TTAATAAGTT AATTGCACCT AGATCTCCAT 

agaQtcttt acctttaaca CGATCTGTCA 

CAGAAATCAG CTTAACTTCT GCACCTTCAT 

40 

AAATTTCAAC AAATGCACGT GGCACTTTGT 
TACCTTCATG GAAGTGCTCT AACAATCGAC 
45 CTTGCTTAAA GTAATTATCA AATGATAATG 

TGAATCCTTC TAAGTATAGA ATAGGCTCAT 

AACTATTGAA TCCTTCTAAA CGATCATAAC 

so 

CTACTTCATC CATAATTTCA CTAGGATGCT 

CAATTGCTTG GAAAATTTTC CAGTCAGGTT 

SS 
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CGCTAATATT ACGATTAAAA AAGAAGCGTT 18 0 

GAACATCATA TTAAAGACAA CTAGACTAAT 24 0 

TAACACTAAT TTCATCATAA ATAGACAGAC 300 

TACAGCTGAC GTTTTTAACA TTCTCGaATT 360 

CTTACATAAT CATAATAATA CATGATGTTT 420 

GCACGTGATT TTTTTGTTTT TCAATATTAT 4 80 

ATTTTTACAA AAATTAAAAA AAGTGCTCCT 54 0 

TTGTAATGTT ATTCTTCTCG AGACATACCT 600 

CGGTTCATGT CGTCATCTTT CAATACGCCC 660 

GGACTCGCTT GATTGGCAAC GTGTAATCCT 720 

TCTGATACAT TGAGTTCACC TAATAAAAAT 780 

GTATAAATAT CTTTATTAAG TTCAACTGCA 84 0 

ATTGCACCAT TTAAAGCATC TAATAGTTTT 900 

GCTTTTAATA TACTATCTTT ATTCGCTGCA 960 

AACTTAATTT GTTCTTCTGA TTTTTCTAAG 102 0 

ATTATTTATC CACCTGATTT CCCGGGAAAA 1080 

CTTGAACACT GTACTGCGGT TGACGTTTTT 114 0 

GTGACTTACC ACGTTTCGTA ATTACCTCCA 1200 

TATCCGTGTA TTGATCAACA TCACTaTTAG 1260 

TTTCCATCGC aTCaTTATTT AATGGAATAT 1320 

CGTGAACTTG TAATACCGCT TCTCCTGTyT 1380 

GAATGCCTCT ATCTTCAGCA AGCTCTGGAG 1440 

ATTTAATCAT TGGTGTTTGA TAAGTCATAT 1500 

CATT G TTTAC ATGAATATCA TAAATTTCAT 1560 

GGAATAATTT TGCTTTACCA TTATCAAAAT 1620 

CAGTACCATC AGGTTGTACT GGCCATTGTA 1680 

TTACCCCAGC ATATAGAGGT GTTAAGCGTG 174 0 

TGTAATTCCA ATCAAATCCT AATCTATTAG 1800 

TTkAATCACC AAGAGGTTCT AATGCTTGGT 1860 
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TTGCTGGCAA TACAACATCT GCGTATGTTG CTGTGAATGT TAAAAATTCA TCTTGGACTA 1980 

CCATGAAATC TAATTTTTCA AACGCAGCTT GTACAAAATT AATATTTGAA TCCACAATAC 2040 

CCGTATCTTC ACCATATAAG TACAATGAGT GTACTTCTCC GTCATGTATA CCTTCTACCA 2100 

TTTCATGATT ATCTTTACCA GCTTTTGGAT TCAATTTAAC GCCATATTCT TTTTCAAATT 2160 

TAGCGCGAAT ATCATCCGCT TCAATACTTT GATAACCAGT AATCTTATCA GGCATACTTC 2220 

CCATATCACT ACATCCTTGA ACATTATTAT GTCCACGTAA TGGATACGCA CCAGTACCAG 2280 

GACGACGATA ATTACCTGTT ACTAATAATA AGTTTGAAAT CGCTGTACTT GAGTCACTAC 234 0 

CAATGTCTTG TTGTGTAATA CCCATTGCCC AACAAATTAC AACAGATTCA GCTTTAGCAC 2400 

ATTCTTCAGC AAATTTAATC AATTCTGATT CAGGAATACC TGTTGCTTCT TCAGCAAAAG 2460 

CCATTGTAAA TGTTTCTAAT GATTTGTAAT ATTCATCAAA ATCATCTACC CACTCATCAA 2520 

20 TAAATGCTTT ATCGTGTAAA TCATGATCAA TAATATACTT AGTCACTGCA CTTAACCACG 2580 

CTAAAT CCGT ACCTGGTTTA GGTTGATAAA AACGATCCGC ACGTTCTGCC ATTTCATGTT 264 0 

TTCTAATATC AAATACATGT ATTTTTTGAC CAAATAATTT TTGTGCACGT TTCATGCGTG 2 700 

ATGCGATAAC TGGATGAGCT TCGGCTGTAT TAGTACCTAT CAATACAGAC ATTGCCGCTT 2760 

TTTCTAAATC TTCAATACTA CCTGAGTCAC CGCCGTGTCC AACCGTTCTA AATAAG CCTT 2820 

TTGTTGCAGG TGCTTGGCAA TATCTTGAAC AGTTATCAAC GTTATTTGTG CCAATAACTT 2 880 

GTCTTGCTAA TTTTTGCATT AAATACGATT CTTCATTOGT CGCTTTAGAA GAAGAAATGA 294 0 

ATGATAGTGC ATCTGGGCCA TGCTTTTCTT TAATAGCTGT AAAATTATCT GCAATGACGT 3000 

TTAAAGCTTC ATCCCATTCT ACTTCATGGA ACTCACCATT TTTCCTTACT AGTGGTTTAG 3060 

TTAATCGTTG ATCTGAATTA ATATGTCCCC ATGAAAACTT ACCTTTAACA CAAGTCGCAA 3120 

TTTTATTTGC TGGAGAATCA TGTGATGGTT GTACTTTTAA AATTTCTCTA TCTTTAGTCC 3180 

4Q AAACTTCAAA TGAACAACCC ACACCACAAT AAGTACACAC TGTTTTAGTT TTCTTAATAC 324 0 
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gctctttacg catttctgct tctgaatctg agattgcaaa tagtggacca taaccaggtt 3300 

ctgctttttt agttaaatca atcattgctg ctaatgaacc aggttccgta tcagtcatat 3 3 60 

45 aacccgcatt accttccata ttcacttcca tcatggcatt acatggacat accgtcgcac 34 2 0 

attgaccaca agatacacat gaagactcat taatcggtac atcattatcc caaataacac 34 80 

gtggatgttc acgatcccaa tcaattctaa tagtttcatt cacttcgata tcttgacatg 3 54 0 

SO 

CTTCTACACA ACGCCCACAT AAGATACATT GATTTGGATC ATAACGATAA AATGGGCCGT 3 600 

AATCTTTTTC GTATGGCTTC TCTTTATATT CATACGTTTG ATGCTGAAGC CCCCATGCAT 3660 
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TATGCTTTTC TAAAATTCGA TCAAGCGCTT CTTTTTGAGC ATCTTTCACA TCATTGTTCA 37 80 

CAGTATTTAC AGTCATTGGA CGATCAATCA CCGTACTACA TGAACGTTCA ATTTTAC CGT 3840 

CAATCTCAAC AGTACATGTA TCACATGTTT GAATTGGTCC CATCGACTCG TTATAACAAA 3 900 

TTGAAGGTAC AAAAGTATCT TGTGATTTAA TAAATTCAAG TAAATTCGTA CCTGGTTCTA 3 960 

CAAGATAATC TTTTCCATCA AGTGTAACCA CCAAATGTTC TTG CAT ATT A CTCACCCCGT 4 020 

CTATATATAT TTTCCGTAAA TGACTTTTAA TAAATTGCTC ATATCCACCT AAAATAACGA 4080 

TGCCCCACAC ATCTTT CAGA TAGAATTAAT TTAATTGTAT TACTTTATGT ACTAGTTGTT 414 0 

AAGTAAAATT TTGTATTTTG CCTTTTTACA ATCATTTTTA TTTGAAATAT TTTGCGCGAA 4200 

ATTAAATCAT CTTTTTGTTT AATTGAAAAT AATTATCATT ATTAGTTTTC CAATTATCTG 4260 

TTTCACGCTT TTTG CCAT AT CTTTCACAAC CTTATTAATG ACAATATTTA ATAATCACCT 4320 

20 CACCTAAAAA TCGTTATACT ATTTATAAAT ACCCTTTTTC TGAAAATTAA TAACCCAAGT 43 80 

TTGATAAATA TCTACTATCA TTTAGAAGGT AATATTTATC TTTAAATTAA ATTTGTAATG 444 0 

GATTAATTTA TAAAAATCAA ATCAGGCATT AAATAAAATA GCCCATAAAT ACAAAGTGTT 4500 

25 ATCACCTTCT ATTTACGGGC TATTAGTTCT ATTCGTTATT CTATTTACAG ATCATTCTAT 4 560 

CTAATTAATT TGTGTACAAT TTTGATAACT TATTTTCCCT TAGTTTACTA CTCTAGATTA 4620 

TCTTTTAATA ACTTAGTACT TTCAGCTTTT GACTGCTCAC TAGGAATGAA GTAGTACAAT 4 680 

CCGTCACTTT GAATGCCGCC TTGACCACTC AATTGATGTT TATTAATCGT GTCATTAGCA 4 74 0 

TCTTTATAAT TGCTTCTAAT CGTATTCAAA TCACCTAATG TTAAATCTGT TTTAACATTA 4 800 

TTTTGAATTT CATTCATTAG ACTATTAAAA TGTGTAATCG ATGATGGGCT TGCAATCTTA 4 860 

TTGGCCATCG CTTCAAGCAC AATTTGCTGA CGTTGTTGTC GACCAAAGTC ACCACCAGCA 4 920 

CCTTCTTCTT TACGACTTCT AATAAACTTC AATGCTTGAT CACCATTTAC ATGTGTCTGC 4980 

TGTCCTTTTG TAAAACGAAC ACCATCAACA GTGAATGTAT CATTACTTAC TACATCAACA 5040 

CCGCCGATGC TATCTATCAT ATTATGCAAA CCATCCATAT CGATTGTCGC ATAATGATCA 5100 

ATTGGCACAT TCATTAATTT TTCAAGTGAT TTAACAGCCA TATTTGGTCC ACCATATGGA 5160 

45 TAGGCATGTG CAATTTTTTC AGTAGTACCA CGGCCAACAA TTTCCGCTCT TGTATCACGC 52 20 

GGTATACTTA CTATTTCAGT TTTCTTCGTT TTAGGGTTGA TAGATAAAAT CATAATACTA 52 80 

tCACTACGCT CTCCGCCACC CTTTTTCTTA CGATCAGCAT CTGAATCGAC ACCAAATAAA 534 0 

so 

GCGATTGTGA ATGGATCACC ATCGTTTAAA CTCACTTTTT TATCTCTTAA TTCTGAATGA 54 00 

TTGCGATCTA ACGGATTGTG TATCTTATTA CCAGTAATAA AAATTTTAGC AGCTACATAC 54 60 
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GGTAGGCTCA TTTTACTTTT AGACGAACGT TTCAATCCCA CCACTCCTTT ACTATTCCTT 558 0 

ACATACTTTG TCTGTTTTCT CTATTTATTA TATAGTAAAA TAATTTTTTT ACTATACTTC 5640 

TGTAGACGTA TAACTATTTT TTATCATTTT TTATCTCTAG AGAATATCTA TCTGTATTTT 57 00 

TGATAACCAC CATTTGCATT TAAAATTTTA AGTACCGTTT CATGACATGC TTTATTACTT 576 0 

ATAATAAAAG GTGCACCCTT TAAATGATCA ATTGCCTTAC CATCTAAAGT CGTCATTTTT 5820 

AGATTCAATA GTTCTGCAAA TAAAAACTGT GCAGCAATGT CCCAAGGTTT AGGATTTGTA 588 0 

TTAATATGTG CCCCAAATTG ACCTTTTGCC ACTCGCATAG AATCTAATCC GCAAGCACCA 5 94 0 

ACTAAACGAT AACTAAATGA GGCGTCAAAT AAATCTTGCA CCGTATCTAG ATTCATCACT 6000 

TGTGCATTAA ACGATATAAT AGCGTCTTCC AATTTTAACG ATGGTGGTTC TTCCATCTTA 6060 

ATTCCATTAC AAAAAGCACC TTCTCCTCGT ATTGCTTTAT AAAGCTTTTT ATGCGGATAA 6120 

20 TCATATACGT ACGATAACAT TGGTTTACCT TCATAAAAAT ACGCCAATAT AATACAATAA 618 0 

TCTTCTTGCT GTTTTACTAA ATTGGCAGTT CCATCAATGG GATGCATAAT CCATAAATGA 6240 

TTAATTTCAT TCGTAATCAT TTCATTACTT TTTTCTTCCG CTAATAGTTG GTGTTCCGGA 63 00 

25 AAATGTGTTG CTAAAAATTG TTGGAATTGT TGTTGAATCT GTTTATCTAC ATTTGTAACT 6360 

AAATCAAATC GATGACGCTT AGTTTCTGTA GTCATTTCCA TAATTAATTG CGGAATAACA 6420 

TTGTCTATTT GTTTCAACCA CGAACATATT AACTTATCTA TTTGCTGTAA TGTTTTATCT 64 80 

GTCATTTCGT CCACCACTTC TCATATCATT ATCATTTTAT TATTACCCTA TATTAAAAGA 654 0 

ATCAACAATA CAACTGAAGA CTTCTTCATT TTATGCATAA AAAAATCGGC TAGTCACGTG 6600 

CTAGCCGACA AATAGAAAGG AAAGTAAGTA ATAAATATTG AAGATGTTGT GATGTAACTT 6660 

GAACGATTAA AAGCTATCTG TT AT AT AG CT CTACCCCTTT GTTTAATCGC TCCCCCTGTT 6720 

ACAAGTAATA TCATAGCACA ATCTTTTTTA AAATGTAAGC GTTTTCCACA AAATTTTTAC 6780 

GATTTTTTTA AAAAGATATT GAAAATGTCC TCATTGTCAC TCTTATGTTA TACTTTGTGT 6840 

40 



30 



35 



AATATATCAT CTTTTAGGAG GTGGCTGTCA TGAATAAAGC TGAAAGGCAA AATTTAATAA 6 900 

TTACTGCAAT TCAACAAAAT AAAAAAATGA CCGCTTTAGA ATTAGCTAAA TATTGCAACG 6 960 

45 T ATC CAAACG CACAATTTTA AGAGATATTG ATGATTTAGA AAATCAAGGT GTTAAAATTT 7020 

ATGCGCATTA TGGGAAAAAT GGTGGTTACC AAATACAACA AG CACAATCT AAAATTGCAT 7080 

TAAACTTATC TGAAACACAA TTATCAGCCT TATTTTTAGT GCTTAATGAA AGTCAGTCGT 7140 

SO ACTCGACATT ACCATATAAA AGCGAAATCA ACGCAATTAT AAAACAATGT TTAAGTCTTC 7200 

CACAAACACG CTTAAGAAAA TTGCTTAAAC GCATGGACTT TTATATTAAA TTTGATGACA 7260 
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ATGTGATGTT AGTAGATCAT AGGGTTGATG 
TTGGCCTTTT GTGTAAACAT GGACATTGGC 
5 AAACTGCCGA ACTCGAAATT GAAAATATTA 

TTCAAACCAG AGACATATCC ATTGATAACT 
AAAAAACAGC AGTAAGATGA TTTTCAATTA 

10 

ACAATACTTC GTATTGAATG GnTTCGCTTT 
ACTGGCACTG CTCCCTCAGG AGTCTCGCCA 
TTTGAAATAC TTAAAAAAAT AAAACACTTT 

15 

GTTAGAATTC CTCAAAATGA TATTTCGCGA 
GATAGCGAAT TCGATGAATT CAGACATCAT 

20 ATGTTAAAAA TCACCTCATA TTCATATACT 

AAATTACTTC ATAACAGTAT TCGAATGATG 
AAAACTATTA ATCTTTTTAG AGTGAATCCT 

25 ATTCAGTTTC ATAATAAAAT GCATATCAAA 

AATCAGCTTT TTTCaTTGCC TAAAAACTTA 

ACTTATTACT GATATAACGA AAGAAACAAA 

30 

ACCTAGGTTT CTTCCAGATT TTAAATAAGT 

TGGACCAAAC TCAAACGGCG ACTTTGCATC 

CGAAACAATA CTCATAGCTA TAAAATTAAA 

35 

TCTAAATACG ATTTCTTCAA CTATTGGACC 
TAAAAATGCA GGCACTTCAA ACATTTTATT 
TTGCAAATGT TTAGGTAGAA ACTGTGTCAT 

40 

AATAATATAC GTTATTGACA ATCTAAGCCA 
AAGCCTTGAT GGCATCACTT TTAAATGAAA 

45 TGCTAAAGCT TGTGTGATAG TCGCTACAAA 

AAACAAAATT GGTCCTATGT AAGCTGCAAT 
TGGAATTATA AG CAAATCT C TCCATGCTAT 

SO TTCCaCTGTT ATATCCtTTC CTGTTTAATA 

AACGAAACTA AGTATATGAG ACAACAAATT 

55 



ATAATATTAA AGCTGAAAAC GTTATATTTA 73 80 

ATGCAGTCAT TTATGACATT GCTCAAGACA 744 0 

TAGATATTTC GTATTCATTC GGTAAGACGA 7500 

ATCATCAATT TTTAAAC CCC ATCGATTCCT 7560 

GAAAATATCT TGCTGCTGTT CTCTATTTAT 7620 

CCTAGGGTGC CGTCTCAGCC TTGGTCTTCG 76 8 0 

TTAATACTAC GTATTAACAT GTAATTTTAC 774 0 

GCCCAACTTA CACTACCAAT AGAAACTGCT 7800 

TATGTTAATG AAATTGTTAA AAAGATAGCT 7860 

CGTGGCGCAA CATCCTATCA TCTAAAAATG 7920 

CAATCTGAAT TTTCTGGCCG TAGAATAGAA 7 980 

TGGTTAGCTC AAGATCAAAC ACCTTCTTAT 804 0 

AATACTGATG CGCTAATTGA ATCTTTATTT 8100 

AAAGCTGATT TCTATCAAAT AATTAATAGA 8160 

ATGTCCCGAC CTCTTTATCT ACGCATAAAT 8220 

ATTATTTGCT ATATGTAATG CAATTGTTGA 8280 

GAAAACTAAT ATGATGGATA GTATGAGATA 834 0 

AGTCACATGA ATAAATGCAA ATAAGAACAC 8400 

CTTCTTACCT AATTCTCCAA TTAAAATATG 84 60 

TACAATCACA ATTAATAAGA ATGCTACAGG 8520 

TAGCTCAAGT TCATTGGCTG TTtCACTATA 8580 

ATATTCATAT GTATAAATTA AGATGAGAGC 864 0 

ATATTTTTTG ATATACGCAA AACCAGCTCG 8700 

TAAATAAAAT GCGCCAATCC CAATCGTATA 8760 

TATCAGATTA CTATOGATTT CATAATAACC 8 820 

TGTGAGTGCA TAAAATATAA CACCTATAAT 8880 

ATCTTTAAAC GTGTATTTCT TTTTTTCATT 894 0 

ATTGATTTTT GGAGGTACTT CTACATGATA 9000 

ACTAATTTGA TTCAAATCAT TGATACGATT 9060 
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ATAGTTACTA ATGAATTGAA TAAGTTCAAA GGCTTTGAAA CATCATATAT AATAAACGAA 
AATCAAGTTT CCTATTATGA AATTATAACA CTACTTAATA AACGTCCCCT CgACAAGTCG 
ACTATGGTAA CAAAATTCAA TATCTTAATT TTTATCATAC AGAACTATCT AACGCATTAT 
TTGCAATTAA ATTTGCCCAT TAACCTATTT TTCATAAAAT GTCATTTAAA CAAGTTATTT 
ATTAAAATTC ACTTTATTAC ATAAATTATA CAATTArAAA GTTTCTTCAA ATTGTAAAGA 
TGCATTAATC GAGTTATAAT CATAATGATT AAGATGGT 
(2) INFORMATION FOR SEQ ID NO: 115: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 910 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 115: 
AnGCGTATCA TGTCACGCAT TTTAACTACT TCTTTACCAC AAGATTATAC AGTCACATTA 
GTTGATCGTA TGCCATTTCA TGGATTGAAA CCAGAATTTT ATGCTTTAGC TGCGGGCACG 
AAATCAGATA AAGATGTTCG TATGAAATTC CCTAATCATC CACAAGTGAA TACAGTTTAT 
GGTGAAATTA ACGACATAGA TTTAGATGCT CAAATTGTCT CAGTCGGTAA TTCTAAAATT 
GATTATGATG AGCTAATCAT TGGTTTAGGA TGTGAAGATA AATATCATAA CGTTCCAGGA 
GCCGAAGAAT ATACACATAG TATTCAAACA CTCTCAAAGG CTCGGGATAC TTTCCATAGT 
ATTAGTGAAC TACCAGAAGG TGCTAAAGTC GGTATCGTTG GTGCTGGATT AAGCGGCATA 
GAACTTGCCA GCGAATTAAG AGAAAGTAGA TCAGACTTGG AAATATATCT TTATGACCGT 
GGGCCGCGAA TTTTAAGAAA TTTTCCAGAA AAATTAAGTA AGTATGTTGC GAAATGGTTC 
GCCA AAAA TA ATGTTACCGT TGT TCCAAAT TCAAATATT A AT AAAGTTGA ACCTG GTA AA 
ATATATAACT GTGATGAACC TAAAGATATT GATTTAGTTG TATGGACAGC AGGAATTCAA 
CCTGTTGAAG TTGTTCGTAA CTTGCCGATT GATATAAATA GTAATGGACG CGTGATAGTT 
AACCAGTATC ATCAAGTACC AACATATCGT AACGTCTATG TAGTTGGTGA TTGTGCTGAT 
TTACCACATG CGCCAAGTGC TCAGTTAGCC GAAGTTCAAG GTGATCAAAT TGCCGATGTG 
CTTAAAAAGC AATGGCTAAA TGAACCATTA CCTGACAAAA TGCCGGAACT AAAGGTACAA 
GGTATCGTTG 

(2) INFORMATION FOR SEQ ID NO: 116: 
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25 



(A) LENGTH: 10182 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 116: 

W TTTTTGATTC AAAGTGGTGA TTTAACAAGC ATTTTAAATA GCAATGATTT GAAAGTCACA 60 

CATGATCCTA CCACTGATTA TTATAATTTA TCTGGTAAGT TGTCGAACGA TAATCCAAAC 120 

GTTAAACAAT TAAAACGTAG ATATAATATT CCTAAAAACG CATCAACAAA GGTGGAATTA 130 

AAGGGAATGA GTGATTTAAA AGGCAATAAT CATCAAGATC AGAAACTTTA TTTTTATTTT 24 0 

TCAAGTCCTG GAAAAGACCA AATCATTTAT AAAGAAAGCC TTACTTATAA TAAAATAAGT 300 

GAACATTAAT ACTTATGCTG TAATTATAGA AACATCCAAA TCATCTATTA nAATCCTATA 3 60 

TTATAAAAnC ACCTCACATA ACTCGTTCAA CTGTACCAAA CCACATTACA TTAGATTTTA 420 

GGCTAACTAT TGTGATGTAC ATCAAAAACG AATTTGTGAG GCGTTGTATA TTTTACAAAG 4 80 

GTGACTAGCG TTTCGTATAG CATTTCCAAC ATTACTACAC TCAAGCGTCA CGCTAAAGTT 540 

CGAAATCGAA TCCTTTCATT CAACAAAAGC TCATATCCAC TACAAACTTC ATATCAAGCG 600 

TATAAACTAT CTTGTGATAC TATCTCGATC ATATCTATAG TATGCATTTG TGTTCCGTTT 660 

30 CACTGAAGTA TATGTATCAT CAGTTAAGTA TAAACCGTCA TCCTTCAATG TT A CTTG AT A 720 

AG CAT ATTT C CGTGCTAACC AGG CAATATC TATATAATTT TCTCCTGCGT TTTCATAACT 780 

TCTTAAATCT TCAATATGTG CACTAACTTC AGGGaAAATG ATTCTAACAA CACTTTCATC 84 0 

AACCCAATAT TTGTCATGCA TCCATCGCAC TTGATCTGCC AATAAAGGTA ACTGCACATC 900 

ATTGAAATAT AGACGAAAGC CGTCACTATC ATACATTTGC CGATATGGTA ATGGCTGTTT 960 

TCTAATCACT AACACCTCGC CACCCATTAC GGTGCCTTCT CTAGTATCAT CACTTCCACC 1020 

CGAAGCTTCA TACGTTGTTG GGTCAACCTG TAGTCCATGT ACATCTCCAA TATAAGCATC 1080 

TGGTTTATGT TCCATTGCAT GTCCATGTGC AATCAATGCT AATATTGTAG ATTGTGAAAA 114 0 

TTGAGGCTCC CATTCAATGC GATTAGGATG GCTACTATAA ATTCTAGGTT CATCTATAGC 1200 

CTGCTGAATA TCCATGCCAA ACACTAATAC ATTGATTAAT GTTTGCGCAA CACTAGCAAT 1260 

GATACTTATG GCACCAGGTG CACCTACTGT TAATATTGGC TTCCCGTGAT ACATCACAAT 13 20 

SO CGTTGGAGCC ATGTTACTTA GTGGTCGTTT ATATGGTGCA ATTTCGTTAA TACCACCATC 13 80 

TACTACATCA AAGCCATCCA TTGTCGTATT CAATAACACA CCGTAGCCTG GAATCGTGAT 14 4 0 

ACCTGAACCA TAAATCATAC CAATTGATGT CGTAAATGAA GCAATATTAC CTTCCTTATC 1500 
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ATCAGACACA ACACCATGCT CTATATCAAT ATTTGCTTTA TTGCTATCAA TGAGCGTACT 1620 

GCGTGCTTTT AAATAATCAT CATCAATTAA TGACTGTACA GGCACCTCAT GAAAATTATC 1680 

5 

ATCCGCCAAG TATTGCGCAC GATCACTATA TGCTAAATGC ATCGCTTGTA TCAAATGATG 174 0 

CAAGTAATCA ACAGATCTTG GACCCATAGA TGGTAAATCG ACATGTTCTA ATAACTTCAA 1800 

TATTTGAATT ACCGTGATAC CGCCAGAACT AGATGGTCCC ATTGaATAAA TGTCATAGTC I860 

10 

TTTAAATGTT GCACTGATTG GCGCTTTAAT CTGAATGTCA TATTTGGCTA GATCCTCTAA 192 0 

AGTGATTGTC CCACCACATG CTTTGACAAC ATTGACTAAT TGTTTCGCAA TGTCACCTTT 1980 

15 ATAAAATGCA TTAAACCCTT GTTCTCTTAA TATTTGAAAT GTCTTACCTA ATTCGGGTTG 204 0 

TACAATCCAA TCACCTTCAC GCCAATATTG ATTTTCATGC GTAAATACTT GTGCCGTTTC 2100 

ATGATACTTT GTCAATCGTG CGTGTTGCTG GCGCGAATAT TTTTCAGTAG CCCAATTGGC 216 0 

20 TGCATGACCT TCAATGGCTA GTTCAATTGC AGGATTAATT AAATCTTCCA ATGACAATTT 222 0 

AGCATAACGC TTGTGAATAT AATCAAACAG CTTTGGAATT GCTGG CACAG CGACAGTTTT 2280 

AC CATGTGT A GTCATATCAA AAAATGATTT ATATTCGCCT GAATCATCTA GATAAAATTG 2340 

25 

TTTGTCTACA TGTTCAGGTG CTGTCTCACG TGCATCAAAC GCAGTTOTAC TGCCAGTACT 24 00 

TTGCTCATAA TAT AG CAAAT ACCCGCCACC ACCAATACCT GATGCAAATG GTTCTACCAC 24 60 

ATTCAATGCC AGTTGAATTG CAATCACTGC ATCCATGGCG TTG CCACCTT GATCTAATAC 2520 

30 

ATCCTTACCA ATTTTAGCCG CAAGAGGATG TGATACGGAA ATTAACCCTT CTTTAGATGT 2580 

TTTTGTCTGT TTGTCATTTA AGTTAATGAC CATACTATAT CCTCCTACTT TCTGTTAAAT 264 0 

35 ATTTAAAACA TTATTGATTA ATGGCTTTTT CTACTTTTTC TAAATCTTGA CGTTGCTCGT 270 0 

TAC CAGTATC GACAAGTGGT GTAATCGGTG ATGCAATTTT AAATTTATCG C CACG AT AAA 276 0 

ACTTAATAAA TTGATCCTGA TCTATCGCAT TAACTACTGC TTGTCTCAAG TTTGGATGCG 2820 

40 TCTTAAATAT ACCTTTTTTA ATATTTAGCA TTAAAAAGAC TGACTTGCGT CCATTTTTGC 2880 

GAATAATGCT TAAATTTTTA TCCGACTTAA TTAAATCAAA ATGTTTTTGA TTCACATCTG 2940 

CCAACATATC AATTGAATGA TTTCTAAGTT CTGACAATGC ATTATTCGGG TCACCATTAA 3000 

45 

ACTTCAATGT AATATTTTTA A'X TT T AG CTG GTCCATAACT ACCTTTTTCT GTTTCGTTGA 3060 

ATCCTGGATT ACGTTGAAAC GTTGCTTGAT ATGCATTTTT CTGTGTCATA ATGTATGCGC 3120 

CACTTGCATA CAGCGCATTT TTCCCATCTG AATTTGCAGG AATTGTACTG CTATCCCCAT 3180 

SO 

ATCCTTTTGG ATATTCTTGA TTTACTTGAT TAACAAATTT TTTAGATAAA ATGCCTGCCG 324 0 

AAGAGTGTGT TAAGTAATTT ACCTCTCGAG GCATCGATTG ATCTGTCGTA ATTTTAACAA 3300 

55 
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T AT AAG CTTT AATCAACTTA T CAT AGATTG 
ACTGATCGAT GTCCTCATCT TTTAATATCT 
5 AAGTATTATT GTTAGGCACA GACTTTTTAT 

CTTCAGCCGA TACACGCTCT CCAGTATTAC 
AATCATCATC TCTTAACAAG AAATAAAATG 

10 

GACTTAACGA ACCTTTCGTT GTTAAATGAT 
ACATATTCAT ATTAATTGAA TATACTGACG 
GAATTTCACC ATCTTGTTGT GTCATCACAA 

15 

TGTAATCAAA TTGTTGCCAT ATTAATG CAC 
CTAACACTTT ATTGTCATAT ACT AAATT CT 

20 CTTTATCAAA TACAACTTCA TCTTCAATTT 

TTTGAGTAGA AGCTTTATTT AACAACTGGT 
ATCCTGTAGA ACTAAATAAT GCCGTCATAG 

25 AGTCATCAAT TTGGATATCA TAATTGCCGG 

CTGGTTGGAT ATTCATCTTC ACGTTAAATC 

TCATATCATT TTCATAACTT GCTTGTCCTA 

30 

CTTCAACTTT CGATGACTTT TG AG CCACTT 

ATACCAACGC TAAAACTATA ATTGCGATAC 

TTTTAATGAA TTCTTGGATC TAGTGGATCA 

35 

AAAACGACGA ACATAATACA AACACCAGGT 
TAGTTACTAC CGGTACGTAA AATGTTGCCC 

40 CCTAGGAAAC TTAAACTACT TGTTGTTAAT 

ACAATCATAG GCGCAATCGC ATTCGGTAAA 
TCACCAGTGA TACGTGCTGC ATCTACATAT 

45 CGCATTGTCC GTGCAAATGA TGGTATATTA 

ATACTTGCTC CAAATGATGC AATAATTGCC 
ACTACATCTA AAATTCGCAT TATTAAATTA 

SO 

CCTAGTAACA CACCAAAAAT AACTGCAATA 
AGCTTCGTTC CTACAACTAC GCGTGTAAAT 

55 
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ATTTATCGTC CTTGTCTTTC TCTTTACGCA 34 20 

TGATGTCATT TATATGTTTG TG CAT ATTGT 3480 

CACGTGCTCT ATCTAAAGAA AACTTAACAT 3540 

GTGCTTGTCC ATTGACCACT TTCGCAAAAT 3 600 

CTTTATTGTC CTTATTCACA GCATAATCAT 3 660 

CATTTTCATC TAATAATAAT AACCTTGTGT 37 20 

GCGCAATTGA ACGTATTGGA TCCAATGTAG 3 7 80 

GTGGCCGCGT ATCTCGTTCT CTACTATTGT 3840 

GTGAATTTGG CAATCCAACA CTATTTTTAT 3 900 

TTTTTGATCC ATATAAAGGC GCCATATACC 3 960 

GCTTATATGT TTGTTTAACA TCTGCTTCAT 4 020 

CTACATGTTT ATCTTTCAAT AAACTATTTG 4 080 

CATAGTTCGG GTCACCAAAC ACTGTCATCC 4140 

CTTGACGTTG TGTACGATAG CTACCATAAT 4200 

CTGCATTTTC CAATTGATCT TTAACGATAT 4 2 60 

GGAAATGTAT TGTTGGTCGC TCGCCTTTCA 4 320 

CTGATTTCGT AGGGACACCA CAACCACTTA 4 3 80 

TAATGATTTT CTTCACATCT ATCCCTACCT 444 0 

CGCACTGCAT CACCTATAAA ATTAAATGCT 4 500 

ACAATAGCTA AATTACTGTG CGTTTCCAAG 4 560 

CATTCAGCTA CATCAGGTGC AACACCAAGT 4 620 

ACAACCACAC CTATATTTAA TGAAAAACGT 4 6 80 

ATATAACGCC ATATGATATT CCAAGTGTTT 474 0 

TCCATGCGTT TAATTTCTAA AACACTGGCA 4 800 

CCGATACTTA AAGCAATAAT TAAATTTGGA 4860 

ACCGCTAACA ATAATGATGG AATTGCAAAC 4 920 

TCAATATGAT TAAAATAACC TGCGATAGTG 4 9 30 

ACTACTGAAA TAATTGAAAT TGAAAATGTC 504 0 

AAGTCTCTAC CGAAATCATC AGTACCAAAC 5100 
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GTATCAAATG TAAATTGTGA CACAATTGAT AATGTCAGCA TGTAGACTAA AATAAGTAAC 52 20 

CCGATAATCG CAATACGATG TCTAGTAGTT TTTCGTATAA ACGATTCCCA CCCGTTATAA 52 80 

CTATGTATTT GCGATGTACG TTGGTAACGT CTAATACTTA CAAACATTAA TAATGTAAAT 5340 

ACGTTGCCTG TTAATGT CAT CAACAATAAC AACACTTCGA CGATACGTCG CCATAGGTCA 54 00 

TGATGCTTCC ATGTTTGTTC CGTTGTTAAA ATAATAATTA AAATGATGGT TAAAACGATT 54 60 

AG CAATGTTT CAGCAATATA GAACGTATCG GCCACATAAC CTTTAAAAAG ATTTAATGCA 5520 

CTCGTTAATA TAACTAAAAT ATAAGTTGCT ATGGCGTAAC TTGCGAATAA TTTTAAGGAA 5580 

GCTATCTTTG AATTAAGTTG TGCCATATGC CTCACTTCCT TTCGTTGATT TCACTACGTA 5640 

ATTTTGGATC GATTAAAGCA TAAAATATAT CAATAATTAA GTTTGCTAAA GATATTACAA 5700 

TTGATATATA TACGACCCCA CCCATGACTG CTGGAATATC AGGTATTAGT TGTTTTTGGA 5760 

20 CGATATAACG CCCGATACCA TTAATGTTAA ATACTTGTTC CGTCACTGCT GAACCGCCTA 5820 

GTAACTCTGC CACTAGAAGA CCAACTAACG TTACAATTGG AATAATGGCA TTTTTCAAAA 5880 

TATGTTTAAT AACAACTTGT GTCGTCGATA ATC C TT TT GC ATAAGCAGTT AAAACATAAT 594 0 

25 CGctGCGCAT TACTTCAAGT ACAGAAGACC TTGTCATACG CGTGATAGAA GCAGCAATAC 6000 

TTGTTCCAAT GACAAGTACA GGTAAAATCA ACGATATTGG ATGTTCTGGC ATATAAGATG 6060 

GTGGCAAAAT ATCCAATTTC AATGAGAACG CTAAAATGAA TAATAGCCCT TGCCAGAAAC 6120 

TTGGAATAGA TAAACCAATT AATG CAATTA TCATTAACGT GATATCAAGC CAACTATTTC 6180 

GCTTCATCGC ACTGATAATA CCAATTGGTA TTGCAATAAT TAATGCCACC ATTAGCGCTA 624 0 

ATACTGCGAC AATTATTGTA ATTGGAATTC TTTCGCCAAC TGCTTTAGTC ACAACCTCAT 6300 

TCCCTTTGTA AGTCGTACCT AAGTCAAAGG TAAAAACACC CTTGATGGTA TCCCACAATT 6360 

GAAT3AAATA AGGTTCGTTA AGATGATGTA ATACATTGAA TTGATGTATC TGTGCCTTTG 6420 

40 TTGCATTTTG TCCCAGTATG CTATAAGCCG CATCAAGCGG TGAAAAATAC AGAATGGTAA 6480 

ACACACTGAC AATAACACCA ATGATGACAA TCACAGCCAT GACAATTCGT TCAAAAATAT 654 0 

AT CTAACT AA TGGCTGTAAA TAAAAAGTCA ATAAGATGAA CATCGGCAAG GCCAATATCA 6600 

45 CTTTGATCAT GATGAACTTA TGAAATAATA CATTTTCAAA GTATGTTGAA AAATGTGCTT 6660 

GTTCAATATT CTTTGAACTC GTATTAGAAC TTTGTGCCTT GAATATTTTT AATGCTTCTT 6720 

TATGTATTTG TGTGGATGAC TTTTGCTGCG ATAAATATTT ATATTTTTGA TGTAACGCCT 6780 

GTTCAATTTC TGAAATTTCA GAATTATTAG CGTAAAAATT TTTCCTCTTA GCAGAAAAGA 684 0 

AAAACTTTAT CACTGCATAT AAAAATATTG GCAAGCTTAA TACCGATAAT ACAAACTTGT 6900 
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CTTGTAAAAT AATCTTGAGT AGATTACTAT 
ATTTGTGaAT AGGGAGGCAC AACATCATGT 
5 TACAATTCAA TTATGATGAA ACTACAGTTC 

GAAAAAAACA TATCCTAGGT ATTGTTGGTG 
AATCTATTTT AGGGCTACTA CCAGATTATC 

10 

TTAATGGGCA ATCGTTAAAT AATTTATCAA 
ATATTTCAAT GATTTTTCAA GATCCACTCT 

15 AACAAATTAC AGAAGTAATA TTTCAACATA 

TGACAATAGA CATTTTAGAA AAAGTAGGTA 
ATCCACATGA ACTTTCTGGT GGTATGCGTC 

20 TAAAGCCACA AATTTTAATC GCAGATGAaC 

ATCAATTACT GCAGTTAATG AAGTCCCTTT 
TCACTCACGA TTTAGGCGCT GTGTATCAAT 

25 GAAGTGTCGT TGAAAGTGGC ACGGTTGAAA 

CAAAACGCTT AATAGATGCG ATTCCTGATA 
ACAATGATAT TTTATTAAAA TTCGATCGCG 

30 

CCTATACCGA GCAGTTAATG ATATTAACTT 
TGTCGGTGAA TCAGGGTCAG GGAAATCGAC 
AGTGTCAGAA GGCTTTATTT GGTATAACGA 

35 

ATTGAAATCT TTACGACAAG AGATACAAAT 
TCCAAGATTT AAAGTCATTG ATGTGATTAA 

40 AGATAATGAT GACATTATTA AAACTGTCGT 

AACTTTCTTA TATCGCTATC CACACGAATT 
CGCGAGAGCA CTTGCTGTTG AACCTAAAGT 

45 AGACGTTTCA ATTCAAAAAG ATATCATCGA 

CATCACTTAT TTATTCATCA CACATGACAT 
TGCAGTTATG AAAAATGGCG AAATCGTTGA 

SO 

TCCGCAGTCA GACTATGCAA AGCAACTTAT 
GTCATGCGTT GTGCAACTTT ATCACTGTAT 

55 
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GATATACAAA AGTATAGAAT AAATTTACAC 7020 

CAAATTTATT AGAAGTCAAC AGTCTGAATG 7080 

AAGCGGTAAA AAACGTCTCT TTCGAATTAC 714 0 

AATCAGGATC AGGAAAAAGT ATTACCGCTA 7200 

CAGATCACAC ATTAACAGGA GAAATTATTT 726 0 

CTTCAGCGTT ACAACAAATT CGAGGTAAGG 732 0 

CTTCGTTGAA TCCAAGATTA ACGATTGGCA 7380 

AACGTGTATC TAAATCTGAA GCAAAGTCGA 744 0 

TAAAACATGC AACTCGACAA TTTGATGCTT 7500 

AACGTGTCAT GATAGCAATG GCATTGATTT 7560 

CAACAACGGC ATTAGATGCC AGTACACAAA 7 62 0 

ATGAGTACAC AGAAACATCT ATTATTTTTA 7680 

TTTGCGACGA TGTGATTGTA ATGAAAGATG 7740 

GTATTTTTAA ATCGCCACAA CATACCTATA 7800 

TTCATCAAAC GCGTCCGCCA AGACCGTTAA 7860 

TGAGyGgGAT TACACATCAC CGAGTGGCAG 7 92 0 

GGCTATTAGA AAAGGCGAAA CATTAGGCAT 7 980 

ATT AG CT AAG ACGGTCGTCG GTCTAAAGGA 804 0 

ATTACCATTA AGTTTATTTA AAGATGATGA 8100 

GATTTTTCAA GATCCATTCG CATCTATTAA 8160 

ACGACCACTA ATCATTCATG GGAAAGTCAA 8220 

ATCGTTGTTA GAAAAGGTTG GCCTAGATCA 8280 

ATCTGGTGGG CAACGTCAGC GTGTAAGTAT 834 0 

GATTGTTTGC GACGAGGCAG TGTCCGCTTT 8400 

GTTATTAAAA CAATTACAGT TAGACTTCGG 8460 

GGGTGTTATC AATGAAATAT GTGATCGCGT 852 0 

ACTGAATAAC ACAGAAGATA TTATCAAACA 8580 

TTCAGAAGTA GCAGTTATTG CTAAATAAAA 864 0 

GGTCTGAAAT AAATTGCGCG ACTTCTGATG 8700 
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TATCAAG TTT 


TAGGTGCTTT 


GCCATGATTT 


AAGAGTCACC 


CCCATACTTT 


GGGCATTTTA 


8820 


ACGCCAGAAT 


AAATCCCCCG 


CCACTATGTG 


AAGTGTGGGG 


GATTATTTAT 


ATTTTATTAG 


8880 


AATATTCAGA 


TTTTTGAGTG 


TGTCAACTTA 


GCTTAGTCAA 


TGTATATTTA 


ACGTCACTTA 


8940 


CTCTTTTTCT 


TTCATAATTA 


ACACATTCAA 


ATAAACTTTG 


ATCAAAAAAC 


ACAAAGTTAA 


9000 


AAGTACCATC 


TTGTAATATG 


CTCTCATACA 


TTATCCCGTG 


ATATTTAAGG 


CTTCGAATAT 


9060 


AATCAGCTAA 


ATATTGAAAT 


GGCAAATAAT 


CTATTCCTTG 


TTCATCGCTT 


GGATTTGTTA 


9120 


TTCCTTTATG 


AATCTTTTrr 


AATGTTTGGT 


AATTTACAAA 


ATACTTTCTA 


AATC CAT CAT 


9180 


CGCCAGCTTT 


G ATTG CATT A 


CTAGTTAAAT 


TAGTTAAATT 


CGCAATTTTC 


AATTTCTCTT 


9240 


TTGTCACGTT 


TTTTTGTAAC 


TTAACCTTAC 


CTATATAAAT 


AATGTCATTA 


TGCTTAGGTT 


9300 


TAACTTCTTC 


TATACTGACC 


TGTTCTTTTG 


TACTAAGGTA 


TAATACGCTT 


ATCCATTTAG 


9360 


AATTCAATCT 


TCCTGCCGTT 


GCAAATCCCT 


TTGGTGGTGA 


CATTAGTTCA 


CTTTTCTCTG 


9420 


TAATGAACTT 


AACTATTCTA 


GATCTATATA 


ATGGTTCAAA 


TCTTTCTCTA 


AATTCCTCAA 


9480 


TACTATAGTA 


ATTAGTAGTG 


ATATCGAGAA 


AGAACGCTAA 


ATTCTCTAAA 


TTGATCATAT 


9540 


TTTTATGAAA 


TCTATTTTTA 


TACTTCAAGC 


TCTCACAAAA 


TCCATCCGAG 


TCATTATTTG 


9600 


CTACAATTAG 


AXTTTTATTT 


GTATATTTTT 


TATCGTTTAT 


GATTTTAGCG 


CCTACTAAAT 


9660 


CTTCCAACAC 


TCGTCTATCT 


AAATTTTCAT 


CATCTTTAAA 


AAGTTCATTT 


AAAATACAAC 


9720 


TTATTTGAGC 


TTCCTCAACA 


TTAAATATAC TCCAGTCGTC 


TTTTAATGCT 


ATTTCAATCT 


9780 


TTTTACCTTC 


TTTTGGGCTA 


AAAGTATCTG 


GTAAATTTAT 


ACTAATATCA 


TATAATTCTA 


9840 


ATGCTGGTCT 


TAAATAATCT 


CTAATAAGTT 


CTAATTTATC 


TATGTCCTTA 


GTCGTATCAA 


9900 


ATATTTTAAC 


ACCAAGATGA 


TTGTTATCAA 


TATCACAATT 


GTCAAATTTG 


CTATTTATCA 


9960 


TTTGG^ATGA 


TTTCTACGAT 


TTCAGTATTA 


TTAAAACATT 


TTTCACATAT 


TTTCATTTTG 


10020 


AGACTCCAAG 


TATCTATTCA 


TAATTTCTAG 


GTGATGCATG 


ATAGATAACC 


TTTTAATTAA 


10080 


ACCTAATCCT 


GGATaCTTAT 


TATTTTCATT 


TAATTCTTCA 


AATTGTCCCA 


AGCGCATAAG 


10140 


atctattttt 


AATATCTAAG 


ttttttgacc 


ATGTTACTAA 


TT 




10182 



45 

(2) INFORMATION FOR SEQ ID NO: 117: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3491 base pairs 
(8) TYPE: nucleic acid 
50 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



55 
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AACTCAGGCA ATTGAAACAG CATTAGGTGC 
AAAAGATGGA CGCCAGGCTA TTCAATTTTT 
5 TTTACCATTA AATGTTATAC AGAGTAGAGT 

AGAGGCAAAC GGATTTATTA GTATCGCTTC 
AAATATTATC GGGAATTTAT TAGGTAATAC 

10 

TGAATTGGCA CGTGCGATTA AATATCGAAC 
AAATCCTGGT GG t TCTATG A CTGGTGGTGG 

1S AAAAGACGAG TTGACAACAA TGAGACACCA 

ATTTGAACAA CAATTTAAAG AGTTGAAGAT 
TGAAAAAAGT CAAAAGCATA ATACACTTAA 

20 CGATAGATTA ACTACACAAG AAACACAAAT 

AAAAAATGAT GGTTATACGA GTGACAAAAG 
TCTAGAAAGT ATT AAAG CAT CTTTAAAACG 

25 ACTTTCTAAA GAAGGTAAGG AAAGCGTTAC 

ATCTGATCTT GCTGTGGTTA AAGAGCGTAT 
AAATAATCAA AATGAACAAA CTAAACATCA 

30 

CTTTAATTCG GATGAAGTGA TGGGCGAACA 
TGGTCAACAA GAAACGAGAA CACGCTTATC 
TATTGAGTTG AATGAACAAA TCGATGCGCA 

35 

T ATTTT AG CT ATCGAAAATC ACTACCAAGA 
ATTWVTTCAT CATGCGATAG ATCATTaAAT 

40 ArATCTGAAT ATACGaGTGA TGrATCGATg 

AGaTGyCGAT TGATGrACTA GGTCCTGTAA 
TAAATGAACG TTATACATTT TTAAGTGAAC 

45 CATT AG AG CA AATTATAAGT GAAATGGATC 
TCCATG CT AT TCAAGGACAT TTTACAGCTG 
CAGAATTGCA ATTAACTGAA G CCG ATTATT 

SO 

CACCGGGTAA AAAGTTGCAA CATTTATCGT 
CTATTGCTTT ACTATTTGCA ATTTTAAAAG 
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TTCATTACAA CATGTCATTG TAGATTCAGA 60 

AAAAGAACGT AATTTAGGTC GTGCGACGTT 12 0 

GGTAGCGACT GATATTAAAT CTATTGCTAA 180 

GGAAGCAGTT AAAGTAGCAC CAGAATATCA 24 0 

GATTATCGTT GATCATTTAA AGCATGCAAA 3 00 

TCGTATTGTT ACTTTGGAAG GTGATATTGT 3 60 

CGCTCGTAAG TCAAAAAGTA TTCTGTCTCA 420 

ATTAGAAGAT TACTTGCGTC AAACAGAATC 4 80 

AAAAAGTGAT CAATTAAGTG AACTGTATTT 540 

AGAGCAAGTG CATCATTTTG AAATGGAGCT 600 

AAAAAATGAT CATGaAGAAT TCGAATTTGA 660 

TCGACAAACT *TTGAGTGAAA AAGAAACTTA 720 

ACTAGAAGAT GAAATTGAAC GCTACACAAA 7 80 

TAAAACACAA CAAACCTTAC ATCAGAAACA 84 0 

TAAAACACAA CAACAGACAA TAGATCGATT 900 

ATTAAAAGAT GTTAAAGAAA AAATTGCATT 960 

AGCTTTTCAA AATATTAAAG ATCAAATTAA 1020 

AGATGAATTA GATAAATTGA AACAACAACG 1080 

AGAAGCTAAA CTACAAGTTT GTCACCAAGA 114 0 

T ATT AAAG CT GAACAATCAA AGCTAGATGT 1200 

GATGrATATC AATTGACTGT TGAACGTGCG 1260 

ACGCATTACG TAAAAAAGTT AAGTTAATGr 1320 

ACTTAAATGC AATTGAACAA TTTGAAGAGT 13 80 

AACGTACAGA TCTT CGTAAA GCTAAAGAAA 144 0 

AAGAGGTTAC TGAAAGATTT AAAGAAACTT 1500 

TGTTCAAACA ATTGTTTGGT GGAGGCGATG 1560 

TAACAGCTGG TATTGATATT GTGGtACAAC 1620 

TACTGAGTGG TGGTGAGCGT GCATTAACTG 1680 

TAAGATCTGC ACCTTTTGTT AT ATT AG rTG 174 0 
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TATCAGACGA AACACAATTC ATTGTTATTA CACACCGTAA AGGAACAATG GAATTTGCAG I860 

ATAGGTTATA CGGTGTAACA ATGCAAGAAT CAGGTGTTAC TAAACTTGTG AGTGTGAATT 1920 

TAAATACAAT AGATGATGTG TTGAAGGAGG AGCAATAATG AGCTTTTTTA AACGCTTAAA 1980 

AGATAAGTTT GCAACAAATA AAGAAAATGA AGAAGTTAAA TCCTTAACAG AAGAACAAGG 2040 

TCAAGACAAA TTAGAAGATA CACATTCTGA AGGTTCAACG CAGGACGCAA ATGATTTAGC 2100 

AGAAAATGCT GAAGTGAAAA AGAAGCCACG CAAGTTGAGT GAAGCGGATT TTGATGACGA 2160 

TGGCTTAATA TCAATTGAAG ATTTTGAAGA AATTGAAGCT CAAAAAATGG GTGCTAAATT 2220 

TAAAGCAGGA CTCGAAAAAT CTCGTCAAAA TTTCCAAGAA CAATTAAATA ATTTGAT AG C 2280 

GAGAT AT CGT AAAGTAGATG AAGACTTTTT TGAAGCTTTA GAAGAAATGT TAATCACTGC 2340 

AGACGTCGGT TTTAATACAG TGATGACGTT AACTGAAGAA TTACGTATGG AAGCACAACG 24 00 

20 ACGTAATATT CAAGATACTG AAGATTTGCG TGAAGTCATT GTTGAAAAGA TCGTAGAGAT 24 60 

TTACCATCAA GAAGATkATA ATTCAGAAGC TATGAACTTA GAAGATGGTC GTTTAAATGT 2520 

CATTTTAATG GTTGGTGTGA ATGGTGTTGG TAAAACAACA ACAATTGGAA AATTAGCTTA 2580 

CCGATATAAA ATGGAAGGTA AAAAAGTAAT GTTAGCTGCG GGCGATACTT TTAGAGCGGG 2640 

TGCTATTGAT CAATTGAAAG TTTGGGGCGA ACGTGTTGGT GTAGACGTAA TTAGCCAAAG 2700 

TGAAGGTTCT GATCCAGCTG CTGTTATGTA TGATGCgATT AATGCCGCTA AAAACAAAGG 2760 

TGTTGATATT TTAATCTGTG ATACCGCTGG ACGTTTACAA AATAAmACAA ATCTAATGCm 2820 

AGAATTAGAA AAAGTTAAGC GTGTAATTAA TCGAGCAGTG CCAGATGCGC CTCATGAAGC 2880 

ATTACTATGT TTAGATGCTA CAACTGGTCA GAATGCGTTG TCACAAGCTA GAAACTTTAA 2940 

AGAAGTAACA AATGTTACAG GTATTGTATT AACGAAATTA GATGGTACAG CCAAAGGTGG 3000 

TATCCTATTA GCCATTCGTA ATGAATTGCA CATCCCAGTT AAATATGTAG GTTTAGGTGA 3060 

40 GCAATTAGAT GACTTACAAC CATTTAACCC TGAAAGTTAT GTCTACGGCT TATTCGCTGA 3120 

TATGATTGAA CAAAATGAAG AAATAACAAC AGTTGAAAAT GATCAAATTG TAACAGAAGA 3180 

AAAGGACGAT AATCATGGGT CAAAATGATT TAGTtAAAAC GTTACGAATG AATTATTTGT 324 0 

TTGATTTTaT CAATCCTTAT TGACGAATAA ACAACGTaAT TATTTGGAAT TATTTTATCT 3300 

TGAAGATTAT TCTTTAAGTG AAATCGCAGa TACTTTTAAT GTGAGTAGaC AAGCAGTTTA 3360 

TGATAATATA AGAAGAACTG GCGATTTAGT TGAAGATTAT GAAAAGAAAT TGGAATTATA 34 20 

CCAGAAATTT GAGCAACGCC GAGAAATATA TGATGAAATG AAACCACATT TAAGTAATCC 34 80 

AGAACAAATA C 3491 

55 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4253 base pairs 

(B) TYPE: nucleic acid 
<C> STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 118: 

10 





AGTACGTTTT 


ATAATTATAA 


GTACGTAATT 


AACATATTAA 


CATATCG CAA 


GTATGTATTT 


60 




AAATAAgATT GTTATAATTT 


CAAAGTTCAT 


CCAAGaTTAT 


GGCGTTTGCA 


TTTACCTATT 


120 


IS 


AAAAACGTTA 


TTATATCAAA 


GATGCGAAAG 


ATAATACGGG 


TTTATTTTAT 


GAAAGTGAGA 


180 




AGGATAAAAT 


GGATAATGAG 


CAACGCTTAA 


AAAGAAGAGA 


GAATATAAGG 


AATTTCTCGA 


240 




TTATAGCACA 


TATTGACCAC 


GGAAAATCTA 


CATTGGCTGA 


TAGAATTTTA 


GAAAATACCA 


300 


20 


AATCAGTTGA 


AACAAGAGAT 


ATGCAAGATC 


AGTTACTAGA 


TTCAATGGAT 


TTAGAAAGAG 


360 




AACGTGGTAT 


TACAATCAAA 


TTAAACGCgT ACGTTTAAAG 


TACGAAGCTA 


AAGATGGAAA 


420 




TACTTATACA 


TTCCATTTAA 


TCGATACGCC 


TGGACACGTC 


GATTTTACAT 


ATGAAGTGTC 


480 


25 


ACGTTcTTTG 


GCAGCTTGTG 


AGGGCGCGAT 


TTTAGTAGTA 


GATGCGGCTC 


AAGGTATCGA 


54 0 




AGCACAAACA 


TTAGCAAATG 


TTTATTTAGC 


ATTAGATAAT 


GAGTTAGAGT 


TATTGCCTGT 


600 


30 


TATTAACAAA 


ATTGATTTAC 


CTGCTGCAGA 


ACCTGAACGC 


GTGAAACAAG 


AAATTGAAGA 


660 


TATGATAGGT 


TTAGACCAAG 


ACGATGTTGT 


TTTAGCAAGT 


GCTAAATCTA 


ACATTGGAAT 


720 




TGAAGAGATA 


CTAGAGAAAA 


TAGTTGAAGT 


TGTGCCAGCT 


CCAGATGGTG 


ACCCAGAAGC 


780 


35 


ACCACTAAAA 


GCGTTAATAT 


TTGATTCTGA 


GTATGATCCA 


TATAGAGGGG 


TAATTTCATC 


840 




GATAAGAATT 


GTGGACGGTG 


TTGTTAAAGC 


CGGAGATAAA 


ATTCGAATGA 


TGGCCACTGG 


900 




TAAAGAGTTC 


GAAGTAACAG 


AAGTTGGAAT 


TAATACACCT 


AAGCAGCTTC 


CAGTTGATGA 


960 


40 


ATTAACAGTT 


GGTGATGTTG 


GTTATATTAT 


TGCAAGTATT 


AAAAATGTTG 


ATGATTCTAG 


1020 




GGTTGGTGAC 


ACCATCACAT 


TAGCTAGTAG 


ACCTGCATCA 


GAACCATTGC 


AAGGTTATAA 


1080 




GAAAATGAAT 


CCAATGGTAT 


ATTGCGGACT 


GTTCCCAATA 


GATAACAAAA 


ATTATAATGA 


1140 


45 


TTTAAGAGAA 


GCATTAGAAA 


AATTACAATT 


GAATGATGCA 


TCATTAGAAT 


TTGAGCCTGA 


1200 




ATCGTCACAA 


GCATTAGGTT 


TTGGTTATAG 


AACTGGTTTC 


TTAGGTATGT 


TACACATGGA 


1260 


SO 


AATAATTCAA 


GAAAGAATTG 


AAAGAGAATT 


TGGTATTGAA 


TTAATTGCAA 


CTGCACCATC 


1320 


TGTAATTTAT 


CAATGTGTTT 


TAAGGGACGG 


TTCAGAAGTG 


ACGGTTGATA 


ACCCAGCACA 


1380 




AATGCCAGAT 


CGTGATAAAA 


TTGATAAAAT 


ATTTGAGCCA 


TATGTTCGTG 


CAaCTATGAT 


1440 
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TATAAATATG GACTATTTAG ATGATATTCG TGTAAATATT GTTTATGAAT TACCTTTAGC i5g 0 

TGAAGTTGTA TTTGATTTCT TCGATCAACT TAAATCTAAT ACTAAAGGAT ATGCATCATT 1620 

TGATTATGAA TTCATCGAAA ATAAAGAAAG TAATTTAGTC AAGATGGATA TTTTATTAAA 1680 

TGGTGATAAA GTGGATGCGC TAAGCTTCAT AGTTCATAGA GATTTTGCAT ATGAACGTGG 174 0 

TAAAGCATTA GTTGAAAAAC TTAAAACGTT AATTCCAAGA CAGCAATTTG AAGTACCTGT 18 00 

ACAGGCTGCA ATAGGACAAA AAATTGTAGC GCGTACAAAT ATTAAATCAA TGGGTAAAAA 1860 

CGTTTTAG CT AAATGTTATG GCGGTGACAT AAGCCGTAAA CGTAAATTAC TTGAAAAACA 1920 

15 AAAAGCAGGT AAAGCTAAGA TGAAAGCAGT TGGTAATGTT GAAATTCCAC AAGATGCTTT 1980 

CTTGGCTGTA TTGAAAATGG ATGATGAATA ATTTTAAAAA ATCAATTAAC AATTTACAAT 2 04 0 

GAATAAAGTT TAATAACTAA AAAGAGGGAG CCTAGGATAA ATTAACGTCC TGGGCTTTAC 2100 

AATGTTATAT TGGCAGCCAT CGACAGAGTT AAAATGAGCT TATAACAATG GGGCCCCAAC 2160 

ACAGAAGCTG ACGAAAAGTC AGCTTACTAT AATGTGCAAG TTGGGGTGGG GCCCCAACAT 2220 

AGAGAATTTC GAAAAGAAAT TCTACAGGCA ATG CAAGTTG GGGTGGGACG ACGAAATAAA 22 80 

TTTTGCGAAA ATATCATTTC TGTCCCACTC CCTTATG CAT GAGTTTTACT CATGTAATTT 2 34 0 

TATTTTTAAG GACATATTAC ATCTGGCTAA TGTGTAAGAG CCACTACATA ATAAATCATT 24 00 

AGTGGTTCTT TATTATTTCT ATCTCACTCC CTCTAAACAA GAATAAATAT TAAAATGAAT 24 60 

CGATATATTA GACAATCATT GATTAAACGT TAAAGTTAAA AGTAAGAATA ATTGCAGATA 2520 

GTCCAACAGG ATATAGCCGA TTGGATAAAA AGTCTGAGAA GCGGGGCATT AAAATGACGG 258 0 

3S TACAAAGTGC ATATATACAT ATTCCATTTT GTGTAAGAAT ATGTACATAT TGTGATTTCA 264 0 

ATAAATATTT TATACAGAAT CAACCTGTAG ATGAGTACTT AGATGCACTA ATCACAGAAA 2700 

TGTCTACAGC AAAATATAGG ATCTTAAAGA CCATGTATGT AGGTGGCGGC ACACCAACGG 2760 

1° CCCTTTCTAT JTAATCaGTTG ^GAAAGATTAC TTAAAGCAATL. ACGTGATACG_TCTACAATCA 2 8 2 0_ 

CAGGCGAGTA TACATTTGAA GCAAATCCTG ATGAGTTAAC TAAAGAGAAA GTCCAACTAT 28 80 

TAGAGAAATA TGGAGTAAAA AGGATTTCAA TGGGCGTTCA AACATTCAAG CCGGAGTTAT 2940 

TGTCTGTTTT AGGTAGAACG CACAATACTG AAGATATTTA CACTTCGGTG TTAAATGCTA 3000 

AAAACGCAGG TATTAAATCA ATCAGTTTAG ATTTAATGTA TCATTTACCG AAACAGACGA 3060 

TTGAAGATTT TGAACAAAGT TTAGATCTAG CTTTAGATAT GGATATTCAA CATATTTCGA 312 0 

GTTACGGCTT AATACTTGAA CCTAAAACCC AATTTTATAA TATGTATAGA AAAGGCTTGC 3180 

TCAAACTTGC TAATGAGGAT TTAGGTGCTG ACATGTATCA GTTGCTGATG TCTAAGATAG 324 0 

55 



30 



45 
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AACATAATAA GGTTTACTGG 
GTTATGTAGA TGGTGTGCGT 
TAAATAAAGA AAGTAAAGCA 
AAGAAGAAAT GTTTCTTGGG 
AGAAGTTTGA CCAATCTATT 
AGGAATTAAT TGTAGAAAAG 
GTAATGAGGT TTTTGAAGCT 
TTAACATTGA CTTACTTTGA 
TGCTAATGAG GTGAAAACAT 
GAGGATTATG TTGATTTTGG 
TTGAATGTTA GTCCTGCTAC 
ATCGAGAAGA CACATAGTTC 
GTCAATCGTT TACTTGAACA 
CAATTGTTAG TTGAGAATCA 
TTATCAAATA TATCTCAATA 
ATCAATAATG TACACTTGAT 



TTTAATGAGG AATATTATGG 
TATACGAATA TCAATCCAGT 
ATTTTAGTAT CAAATAAACC 
TTGCGTTTAA ATGAAGGTGT 
GAAAGTGTCT TTGGTCAAAC 
AACGATGTGA TTGCACTTAC 
TTCCTAATAA ATGATTAAAA 
CCAATTTGAT AAATTATAAT 
GATTACAGAT AGGCAATTGA 
ACAACCCGTT GGTTCTAAAA 
AATTAGAAAT GAGATGAAAC 
TTCAGGGCGT TCGCCATCAC 
AACATCTCAT CAAAAAACAA 
ATATGATGTA TCATCAGCAT 
TACAACTTTA GTTGTTCATC 
TCGTG CTAAT CCTAATTTAG 



ATTTGGAGCA GGTGCAAGTG 
GAATCATTAT ATCAAAGCTA 
TTCTTTGACT GAGAGAATGG 
GAGTAGTAGT AGGTTCAAAA 
AATAAATAAT TTAAAAGAGA 
AAATAGAGGG AAAGTCATAG 
AAAATTGAAA TTTCGAGTCT 
TAGCACTTGA GATAAGTGAG 
GTATATTAAA CGCAATTGTT 
CACTAATTGA GCGACATAAC 
AGCTTGAAGA TTTAAACTAT 
AATTAGGTTT TAGGTATTAT 
ATAAATTAAG ACGATTAAAT 
TGACATATTT TGCAGATGAA 
CTAATCATAA ACAAGATATT 
TTATAATGGT TAT 



(2) INFORMATION FOR SEQ ID NO: 119: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 33 95 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
(DJ TOPOLOGY: linear 

" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 119: 
TCCCTAATCG AACAAAATTA TGCGCATAAA CAAAGTAGAT TGATATAAAA TTCTTAATTA 
TCAGAATATA TTTACAAATC TGAATTTTAT TAGTATATTG GrTAGTrTTC ATAGAGGCAT 
GACGGTaTTT GAGCAGGATT TTAAATCGGg ATTTTATAAT CGATTTAAGA GAGGCCACtT 
TGCTTGcACA TTAATACTGT CAATGGGAGG GGAATGTATA TGAGTrAAGC ACATCAATTA 
ATTCAAGAGG ATGAACATTA TTTTGCGAAA TCAGGACGTA TTAAATATTA TCCGTTAGTG 
ATTGATCATG GATATGGAGC AACATTGGTT GATATTGAGG GGAAGACATA TATCGATTTG 
TTATCGAGTG CGAGTTCTCA AAACGTAGGT CATGCAC CTA GAGAAGTAAC AGAAGCGATA 
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GTACGTTTAG CTAAGAAGCT TTGTGAGATT GCACCTGGAG ATTTTGAAAA AAGAGTGACC 540 

TTCGGATTAA CCGGATCAGA CGCAAATGAT GGCATCATTA AATTTGCCAG AG CATATACA $00 

5 

GGGCGTCCTT ATATCATTAG TTTCACTAAT GCATATCATG GTTCAACTTT TGGCTCATTG 66 0 

TCTATGTCAG CTATTAGTTT AAATATG CGC AAACATTATG GTCCGTTATT GAATGGTTTT 720 

TAT CATATTC CGTTTC CAGA TAAATATCGT GGTATGTACG AGCAGCCACA AG CTAATTCA 780 

10 

GTAGAAGAAT ATTTAGCACC CTTAAAAGAA ATGTTTGCGA AGTATGTACC TGCTGACGAA 84 0 

GTAGCATGTA TTGTTATTGA AACGATACAA GGCGATGGTG GACTTTTAGA AC CAGTTCCA 900 

is GGGTATTTTG AAGCGTTAGA AAAGATTTGT CGTGAACATG GTATTTTAAT CGCTGTCGAT 960 

GATATTCAAC AAGGTTTTGG GAGAACAGGT ACATGGAGTT CAGTCTCGCA TTTTAATTTT 1020 

ACGCCTGATT TAATCACTTT CGGAAAATCC TTAGCAGGTG GTATGCCTAT GTCAGCAATT 1080 

2® r*rnrnnr± 7v rv^/^TA a AriRr!& , r*p&»r' ^RRTT^TTTn rsaarr^rr^r: rurnTTThTT t 74 r»AA ^ a rinT 1 i a n 

GCTAATCCAG TTAGTTGTGA AGCTGCATTA GCCACAATTC AAATGATTGA AGATCAGTCG 12 00 

CTTCTTCAGG CTAGTGCGGA AAAAGGGGAA TATGTTAGGA AACGAATGGA TCAATGGGTA 1260 

TCTAAATACA ATAGTGTAGG CGATGTTAGA GGTAAAGGTC TGAGCATTGG TATTGATATT 1320 

GTTTCCGACA AAAAACTCAA AACACGTGAT GCCAGTGCGG CACTTAAAAT TTGTAATTAC 13 80 

TG CTTT GAGC ATGGCGTAGT TATTATAGCT GTAGCAGGAA ATGTGTTGCG ATTCCAACCG 144 0 

30 

CCATTGGTAA TAACATATGA G CAATT AGAC ACGG CGTTAA ACACTATAGA AG ATG CACTG 1500 

actgctttgg aagcaggtaa cttagatcaa tatgacatat ctggacaagg ttggtaatag 1560 

35 cgattatctt aatataaaat aaaaaatgat ttccacatct ggatgttaat cagatgggaa 1620 

atg atttttt tta tttttt a ttttggtggg tggtattcag ctacgtcatt tttcttagaa 1680 

tgtctaagtc cataacttaa atataggatg ataccaacaa taaaccaaat taaagtgtat 174 0 

fo_ am^^gctt cgaatcctaa tccccagaat actagcaata ctaaaacaaa tgtaattgct 1?°^ 

GGTAACACAG GATATAAAGG TAATTTAAAT GCAGGAATTG GTAGATCTTT ACCTTcACGC 1860 

TTTCTCAAAC GATACATTGC TAATGAAACG AACATAAATG CAACAAGTGT ACCTGCTGAA 192 0 

45 ATTAATTGTG CTAAAAATGC GAATGGGAAC AT AG AAC CAA TTAAAACACC AATAATAGTA 198 0 

AGTATAACTA GTGCGCGATT AGGTAAATGT TTGTCGTTTA AGTGGCTTAA CCATGAAGGT 204 0 

AATAAGCCGT CACGTCCAAA TGAATAAAGT AAACGTGAGC CTGCTAACAT CATACCAATT 2100 

SO 

AATGCTGTAA ACATACCGAT AACAGAGATA GCTTGAACAA TAGCTGCTAC AACACCATGA 216 0 

CCACTTTGAC GTAAAG C CCA ACCAACAGGT TCAGCATTGT TTGCGTATTG TGAGTAATGG 222 0 

55 
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CCAAGAATAC CTCTAGCCAT TGTCTTTTGA GGATCAAGTG CTTCTGCTGA GTTTGCTGCG 
ATAGAATCGA AACCGATATA CGCTAAGAAA ATCATTGAAA CACCAGCATA TATGCCTTGC 
CATCCACCAA AGTCACCTGT AGCAGTTACT TTGTGTTCTG GAATAAATGG CACATAGTTA 
CTAACATTTA TTGCTGTTAA ACCTACGATG ACAAATAAAA TAATAGCTAA TACTTTTAAA 
ATAACTAAAA TATTTTCCAT ACGAGCTGCT TCCGACATAC CACGTGATAG TAATAATGCA 
GTTAATAAAA TAACGATAGC AGCAATAATA TCGATAAAAC CGCCATTTGT ACCAAATGGA 
TTTGATAATG CTGCAGGTAA TTCGATGCCA ATTGGTTTCA CAAGTCCGCG TAAATTCGCT 
GAGAATCCTG ATGCAACAAA GGCTACGGCG ATAAAATATT CAGCTAATAG AGCCCAACCG 
GCAACCCATC CAAAAAATTC ACCAAATAAT ACATTGACCC AAGAATAGGC TGAACCTGCA 
AATGGCATAG CGGCAGCCAT TTCTGCATAA GTAAATGCAA CTAAACCAGC AACAATAGCA 
GCGAGTAAGA ATGATAACGC AACGGCCGGT CCTGCATGTT CTGCAGCAAC AATGCCAGGT 
AGCGTAAAGA TAGATGTCGA TACAATTGTT CCTACACCTA AAGCTAAGAA ATCACGCACC 
CGAAGTGTAC GCTTTAAATG ACCATCTTTA TTTTGATAGA TAGCCGGATC CTCTTTTCGT 
GCTATTTTAT TGAAAAAACT TCCCATAAAC TTTCCTCCCA AACATTCATA AACAATTCTA 
TACGGTGTTT TTTAATATGT TATATCATAG CACAAATAAT CAATATTTTG TCTAAAAATT 
CTGAAAAATC ACAACTTTAT GTTACGTATT AATGACTTGT CTTGATAACA T C CAT AG ATT 
TTTTAAATGA TAAAACTGAT TATAACAGAT ATTAAATGAA TAAGTACTAT TTTTTGCnAA 
TTTTCTAACA ATTTTGCACA TTATATGTTT AAAATCAATT TCATGTTTAT GGTCTGATTG 
GCTAGTGTGT ATGAAATGTA AnTCTTTGAC TnnGA 
(2> INFORMATION FOR SEQ ID NO: 120: 

* (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13508 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: ! 
ATCAGGTAAT GCCATGCGTT TAGCTGAAAA 
ATCAAGTTGT TTTGATGTCA ATGGATGAAT 
ATTTATTTAT TATTACGTCT ACTCATGGTG 
TCTTTGAATT TTTAGAAGAC GATAACGCAC 



;EQ ID NO: 120: 

TTTTTTCAGA ACGTTTAAGT GATATCGGAC 
ATGATACGAC AAACATCGCG CAGTTAGAAG 
AAGGAGAACC GCCTGATAAT GCATGGGATT 
CTAATTTAAA TCATGTGAGA TATTCAGTAC 
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TACTAGAAAA TCTAGGCGCT GAGCGTATAT 
AAGAAGACGC AGAAAAGTGG ATGGCAGACA 
5 GTATTCAAAG TGAATCGGTG ATAAGTGAAT 

CTAAATCAAA TCCATACCAA GCAGAAGTAT 
CAAATAAAGA AACACGACAT ATAGAATTTT 

W 

CAGGAGATTG TATAGTAGCA TTACCGCAAA 
CCATGTTAGG TTGGGATCCG CAATCTCCGG 

1S CTATTGTTGA AGCACTAACA TCACATTTTG 

AAAATGCAGA TATCTATTTT GAGAATGAAG 
GGGCGCGTGA ATATGTTATA AATCGGGACT 

20 . TAGAATTACA ACCTGAGAAT ATGTATCAAA 
CGATTTCTAG TAGTTTTATG G CAACGC c AG 
GTTATCAAGC ACATGGACGT GAGAGAAAAG 

25 TTAAACCAGG CGATATAGTA CCAATTTATT 

TGAAGCAAGA TATACCGGTT ATTATGATTG 
CATATTTACA AGAACGTGAA GAACTTGGTA 

30 

ATCAACACCG TAGTT CTGAC TTTTTATATG 
GAAACTTAAC ACGCGTAGAT TTAGCATTTT 
AGCATCGTAT AATGGAAGAA AGTAAACGTT 

35 

CTAT ATTTGT GGCGATGAAA AATGTATGGC 
ATTGfiTAAAA gaacgtcata TTTCTCAAGA 

40 ACAACAACAA CGCTATCAAC GTGATGTTTA 
TAATGATGTA AAAAGATATA AAGGATGTTG 
TTAACAAATA AAAATGTCGT CATAGTTGGT 

45 ACATTAAATC AATACGTTGA ACATATGACG 
CAAAATATGG TAGATAACGG TGTCGTCATA 
ATTGTAGACG CGTATCTAGT TATTGCAGCA 

SO 

AAAAAAGCCT TACCTGAGCA TGCCCTTTTT 
GTTGTATTTC CAAGTGCACT ACACCGCGAC 
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GTAAGCGTGT AGATTGTGAT ATTGATTATG 360 

TCATTAATAT TATTGATACC ACATCAGAAG 4 20 

CAATTAAGTC TGCCAAAGAA AAGAAATATT 4 80 

TAGCGAATAT CAATTTAAAT GGTACCGATT 540 

TACTTGATGA TTTTAGTGAA TCATATGAAC 600 

ACGACCCTGA ATTGGTTGAA AAACTAATAT 660 

TGCCAATTAA TGATCATGGT GATACAGTTC 720 

AATTTACTAA ATTAACATTG CCATTATTGA 780 

AATTATCTGA ACGTATTCAA GATGAGTCAT 840 

TTATAGATTT AATAACAGAT TTTCCAACTA 900 

TCCTTAGAAA ATTACCACCA AGAGAGTATT 960 

ATGAAGTGCA TATTACCGTT GGTACGGTTC 1020 

GTGTATGCTC GGTTCATTTT GCTGAGCGAA 1080 

TGAAGAAAAA TCCGAACTTC AAATTTCCGA 1140 

GACCAGGTAC TGrAATTGCT CCTTTTAGAG 1200 

TGACTGGAAA AACATGGTTG TTCTTTGGTG 1260 

AAGAAGAAAT AGAAGAATGG CTTGAAAATG 132 0 

CAAGAGACCA AGAACACAAA GAATATGTAC 13 80 

TCAATGAATG GATTGAGCAA GGCGCACAAT 144 0 

GAAAGATGTC CATCAAGCCA TTAAAGATGT 1500 

AGAAGCAGAG TTATTATTGC GACAAATGAA 1560 

TTAGGGATTG GTGTTAAATA TTTTAAGGTG 1620 

CTCAACATGA ATATGCCATT AATGATAGAT 16 80 

GGAGGCGTCG TTGCAAGTCG TCGGGCACAA 1740 

GTCATCAGTC CGACAATCAC TGAAAAACTT 1800 

TGGAAAGAAA AAGAATTTGA ACCAAGCGAT 1860 

ACCAATGAGC CACGTGTCAA TGAAGCGGTA 1920 

AATAATGTTG GAGATGCATC AAATGGCAAT 19 80 

AAGCTAACTA TCAGTGTATC AACTGATGGT 204 0 
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TACAGTTCGT 

ACATATAACG 

GACAAACAAG 

CCGTCTAAGG 

GGCGGCTTTG 

TATGAATATT 

ATTGAAATCT 

TAGAAAGCAA 

TAGTCATGCC 

AGATTTTTTT 

AAGTTAAAGA 

AGTGATAATA 

CTCATTGCCA 

ATGATTTTAG 

GTCATCAACG 

AGTGGTTTAT 

ATTGTCTGTG 

GTAACATTTT 

AAATATTTAT 

GGAGGTCCAA 

TATGGATTAA 

CTTGGATTTA 

ACACAAGATA 

TTTCCTGTAA 

ACTTTAGCTG 

ATAGGTGTTy 

TTAAGAGCgC 

TTTTTAGGTG 

GTGATTCCTG 



ATATCGACTT 
AAAAGCAACA 
CTCAATTTTT 
TAAGTCTTCT 
TGAATAGTCT 
ACAATAGAGA 
GGTTGAAGTC 
TAATAAAAAT 
ATGTTATCAA 
GATAAAATGA 
GGGGGATTAT 
TGTGGTTAAC 
AAAAGATAAA 
GATATAGTGT 
TTGTTATTAT 
TCAAGCCGCT 
CAATGACAGC 
TGCTTTCTAT 
TGATTTTACT 
TGGCTCGTGT 
TACCTATTCA 
AAGAACAGAA 
TAGATGTACA 
AAGGACGTGC 
TTATTCTATC 
CGTTGGCACT 
ATGCGCCGAA 
TACTAAATGA 
CAGAAGTAGG 



TTTATATACT 
GTTACTGTCA 
AGCGTGGTTG 
TATTTTAACT 
AATAATGAAG 
AAAAGATACG 
GTTACTATCA 
GATAGATCAA 
GTAGGAAAAT 
GATAACTTAA 
GTAAATTGTA 
AGTAATGGGG 
TCCAGTTGTA 
GACAGATTTG 
GTTTATCTTT 
TGTCAAACGC 
TTTAATTGGC 
TCCTGCATTA 
ATTAGCATTA 
AGCTGCAGTG 
AATAATAGGT 
ACGTATCAAA 
TAAATTAGTT 
AAGAACAAAA 
GATGTTAATA 
TGTTATTAAT 
TGCATTAATG 
AACCGGTATG 
ACCATACTTG 



TGCCGACAGA 
CAAATTGTGT 
GATGTAAGAT 
TTAACGCTTA 
GATTTAAGCG 
TAGAACAAAC 
TAGCGACCTT 
AATGAAATAC 
CAAACTTCAC 
ATATAAAAAA 
TTAAAAGTGG 
CTCATTATTA 
GGTATGACAA 
GTTGGATTTT 
GCCATTATTT 
TTAATATTAA 
ACAATAGCCC 
TTACCTTTAT 
AGCGCGGCGA 
TTAAAAGCCA 
TTCATTCTTG 
AAAGCAATAG 
GAAGTATATG 
TCATGGATAA 
AATATTGCGC 
TTTAAATCAG 
ATGGCTGCAG 
CTTAAAGCGA 
CATATTATTG 



AAATAAAAGT 
CACAAGAATA 
AATAATAGCG 
ATCATTGAAA 
ATAATGATAT 
TTAATAAAAT 
TAGCCAGATT 
AGGACAGGAT 
TATTGATAGT 
TTATATTAAT 
AGGGAGAAAA 
TTATTTCAAT 
TCATACCTTG 
TTGCTAAAGG 
TCTTTGGCAT 
TGACACGAGG 
AATTAGATGG 
ATAAAGCGTT 
TTATGAACAT 
AAAGTGTCAA 
TTATGTTGTT 
AGAGAAATGA 
AACGAGATCA 
AATGGGTGAA 
CACCTGAATT 
TGGATGAACA 
TGATTATTGC 
TTGCGACCAA 
TAGGTTTACT 



ACTTGATATA 
TTTAAATCAT 
GACCGTCTAA 
TTAAGACATG 
GCGTTTTAAA 
AGGTGGATAA 
TTTTGTGCAA 
ATACAAGGAT 
TACGCAAAAA 
TATAATATTT 
TAATATCAAT 
TGTAGGTTTA 
CTTAGGGGCA 
GTTAGATCAA 
CATGAACGAT 
CAATGTCGTC 
GGCCGGTGCG 
AAATATGAAT 
GGTACCTTGG 
TGAATTATGG 
TGCGGTATAT 
ATTACCGCAA 
AGATGTAAGG 
TACAGCTTTA 
TGCATTCATG 
AATGGAACGA 
AGCAGGTATG 
TTTAATCAAA 
TGGCGTACCA 
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ACAGCAGGGC 


AATTTGGTGT 


ACCGTCTGTA 


TCAACAGCTT 


ATTCAATGGT 


CATAGGGAAT 


3960 




ATTATAGGTA 


CATTTGTCAG 


CCCATTTTCA 


CCAGCCTTAT 


GGTTGGCAAT 


TGGTTTAGCA 


4020 


5 


GAGGCAAACA TGGGCACGTA 


TATTAAGTAT 


GCATTCTTTT 


GGATTTGGGG 


ATTCGCTATC 


4080 




GTTATGTTAG 


TAATTGCAAT 


GTTGATGGGC 


ATTGTGACGA 


TTTAAGTATG 


AAAAAATAGA 


4140 


10 


AACTATGGTC 


ACGTTGCAAA ATGAAATAAT AGTTGCATAA 


ACATGTCGAA 


ATGACGGACG 


4200 


AATCTTTAAA 


r\t\X 1 X 1AAA 


TV TV 'f "T'TV 7V ^v*» * J% 

AATTAATGAA 


ATAATTGTGT 


AGAAATATGA 


ATTTCACTAA 


4260 




ATGTTAATAA 


^-1 Hoi onLvj 


TTTTAGTTAA 


CAGACTAATA 


AAAATTTGAA 


AATACTATAT 


4320 


15 


ATAGTGGTAT 


A Zi f^fT JA 7\ TV* j\ 


GTAGACACAA 


TATATAGGAA 


GAAGGGGTAA 


AATGAATCAA 


4380 




ATCGAAGAAG 


V— ril 1AACvj<j<j 


TTTGATTTCT 


AAAGATCCTG 


CTATTGTTAA 


CGAAAATGCT 


4440 




AACAAAGATA 


*TV^ TV T* TV TV wwii 


TTCAACAATG 


AGAGATTTAA 


CAGCAGGTAT 


CGTTTCTAAA 


4500 


20 


TCTTACGCAT 


1AAA1 CA III 


ATTACCAAAG 


CACGTTGCAG 


ATGCACATCA 


AAGAGGGGAC 


4560 




AT ACATTTT f 


M\-v»AV». 1 1 A(jA 


1 r AT CATC CA 


TTCCAACCGT 


TAACTAACTG 


TTGTTTAATA 


4620 




GATGCTAAAA 


ATATG CTACA 


TAATGGATTT 


GAAATAGGCA 


ACGCGAATGT 


AACTTCACCA 


4680 




AAATCAATAC 


AAACTGCATC 


AGCGCAGCTT 


GTACAAATTA 


TAGCCAATGT 


TTCTAGCAGT 


4740 




CAATATGGTG 


GCTGTAcGGT 


TGACCgCGTT 


GACGAAl 1AC 


t TAGTACATA 


TGCACGACcA 


4 80.0 




TAATGAAGAA 


CAACATAGGA 


ATATsCGCAA 


AGCAATTTGT 


CAAAGAATCT 


GAAATTGATC 


4860 


30 


GTTATGTTGA 


TCAACAAGTC 


ACTAAAGACA 


TCAATGATG C 


GATTGAAAGT 


TTAGAATATG 


4920 




AAATTAATAC 


CTTATATACA 


TCTAATGGAC 


AGACACCTTT 


TGTAACATTA 


GGATTCGGCT 


4980 


35 


TAGGTACAGA 


TCATTTAAGT 


CGCAAAATTC 


7\ A f TV T\ /**»/">»! 1 TV *w 

AACAAGCTAT 


CTTAAATACT 


CGTATCAAAG 


5040 


GCTTAGGAAA 


AGACCGCACG 


ACAGCGATTT 


TCCCGAAACT 


TGTATTTTCA 


ATTAAAAAAG 


5100 




GAACQAACTT 


TAGTCCGCAA GATCCGAACT 


ATGACATTAA 


ACAACTAGCA 


TTAAAGTGTT 


5160 


40 


CAACGAAACG 


TATGTATCCA 


GATATTTTAA 


ATTATGACAA 


ACTCGTAGAA 


ATATTAGGTG 


5220 




ATTTCAAAGC 


GCCAATGGGT 


TGTCGTTCAT 


TTTTACCAAG 


TTGGAAAGAT 


GCGGAAGGTC 


5280 




ATTTTGAAAA 


TAATGGTCGT 


TGTAATCTTG 


GTGTTGTTAC 


ACTTAATTTA 


CCTAGAATGG 


5340 


45 


CATTAGAATC 


TGCCGGTAAT 


ATGACGAAAT 


TCTGGGAAAT 


CTTTTATGAA 


CGTATCGATG 


5400 




TGTTACATGA 


TGCATTACTT 


TATCGTATAA 


ATCGTTTGAA 


AGATGCTGTA 


CCGAATAACG 


5460 




CACCGATTTT 


ATATAAAAGT 


GGCGCATTTA 


ACTATAAATT 


AAAAGAAACA 


GATGATGTTG 


5520 


SO 


CTGAGTTATT 


TAAAAATAAA 


CGTGCAACGA 


TTTCAATGGG 


CTATATAGGG 


TTGTATGAAA 


5580 




CAGCTACTGT 


TTTCTATGGT 


CCAGACTGGG 


AAACATCTCA 


AGAAGCAAAA 


GCATTTACGC 


5640 
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GGTTCAGTAT TTmCAGTACG CCGAGTGAAT CGCTAcGGAT CGTTTTTGTC GTTTAGACCA 5760 

AGAGAGATTT GGAGATATTA AAGACATTAC AGATAAAGGA TATTATCAAA ACTCTTTCCA 5820 

TTATGATGTA CGTAAAGATG TTACACCTTT TGAAAAGTTA GATTTTGAAA AAGATTATCC 5880 

TTATTATGCG AGTGGTGGTT TCATTCACTA TTGTGAGTAT CCGAAATTGC AACACAATTT 5940 

GAAAGCACTA GAAGCGGTAT GGGACTACTC TTATGACAAA GTTGGTTACT TAGGTACAAA 6000 

TATTCCGATT GATCATTGTT ATGAATGTGA TTACGATGGA GATTTTGAAG CAACTGAAAA 6060 

AGGATTTAAA TGCCCGAACT GTGGCAATGA TAATCCTAAA ACAGTTGATG TCGTTAAACG 6120 

AACATGTGGT TACCTAGGCA ATCCAGTTCA ACGTCCAGTA ATTAAAGGCC GTCATAAAGA 6180 

AATTTGCGCA CGAGTAAAAC ATATGAAAGC GCCTAAAGAA TGATACTTTT AGACATTAAA 624 0 

CAAGGACAAG GTTATATTGC TAAAATAGAA TCAAATAGCT TTGTTGACGG TGAAGGAGTA 6300 

20 AGATGCAGTG TTTATGT AT C AGGATGTCCA TTTAATTGTG TTGGATGTTA TAACAAAGCC 6360 

TCACAAAAGT TCAGATATGG CGAGAAATAC ACTGATGAAA J? ATT AG GAGA AATATTAGAT 6420 

GATTGCGATC ATGATTATAT ATCTGGGCTA AGTCTATTAG GTGGCGAACC ATTTTGTAAT 6480 

TTGGATATTA CATTAAATCT TGTCAAAGCA TTTCGAGCAC GTTTTGGAAA TACAAAGACA 6 54 0 

ATTTGGGTAT GGACTGGATT TTTATATGAA TATTTAGCAA ATGATTGTAC AGAACGTCGA 6600 

GAGTTATTAT CATACATTGA CGTTTTAGTA GATGGTCTAT TTATACAACA CTTATTCAAA 6660 

CCTGATTTAC CATATAAAGG TTCTTTAAAT CAACGCATTA TAGATGTACA ACAATCACTC 6720 

TCGCATGCGC GTATGATTGA ATATATAGTT AGTTGAATAT GTATTAGAAG TCAAGGTAAC 6780 

ATTCGTTGCC TTGGCTTCTT TTTAGGTTAG GTACATAATT GAAAGTTAAT AAAAGCAATT 6 840 

CTTTATAAAA ATATATTGAT AGAATATGAC CTAACAATCA TTTTGATACC AATACTAAAA 6900 

GTTGCATATC CGTTTTTTAA AAAAGTTGAA AGAGAAAAGT GGTATTTTAG TGGGAAGGAA 6960 

GTCTAACTTT TTGGTAGCGT TTTACAATAA ATAAATATTC GTTAATAACG TATAAATATT 7020 

CTTAAATGCC ATTCTAGTAA AATTTGTTAA ATTCGTTAAA TCGTAACTTA ACACTGTTAT 7080 

TTTAGCGCTA TTAAG G TTTT GTTTATTACG GGAAAAATTA TATAAATATT CAATAATTGC 7140 

45 CAAGTTTCAA ATTGTATGAA ATTTGCATTA TTATTAAATG TTAGTTATTG TCAATTTTGT 7200 

GAATCAATAT AATTATTACA TTTTGAGATA AATCGAAACA GGATTCATAA AATTAATAAT 7260 

TAGGGGGAGC ACAATTGAAA AAAGAGAAAG TTATGGACTG GACGACCTTT ATAGGGACAG 7320 

50 

TAGCTGTACT TCTTTTTGCA GTTATACCTA TGATGGCTTT TCCAAAAGCA AGTGAAGATA 7380 

TCATCACTGG TATTAATAGT GCCATTTCTG ATTCAATTGG TTCGATATAT TTATTTATGG 74 40 
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40 



675 



10 



EP 0 786 519 A2 

TTGGTAAAGC AAGTGATAAA CCAGAATTTA ATACATTTAC ATGGGCGGCA ATGCTGTTTT 7560 

GTGCAGGCAT AGGCTCTGAT ATTTTATACT GGGGCGTTAT TGAATGGGCT TTTTACTATC 7620 

AAGTTCCACC AAATGGCGCG AAAAGTATGA GTGATGAAGC ACTCCAATAT GCGACGCAAT 76 80 

ATGGTATGTT CCACTGGGGG CCAATTGCTT GGG CTATTT A TGTTCTACCA GCATTACCAA 774 0 

TTGGTTATTT AGTATTTGTT AAAAAACAAC CGGTGTATAA AATTAGTCAA GCTTGTCGTC 7800 

CGATTTTAAA AGGTCAAACA GATAAATTTG TAGGTAAAGT TGTAGATATC TTATTTATCT 7 86 0 

TTGGATTGCT AGGTGGTGCG GCAACATCAC TAGCGTTAGG TGTGCCATTA ATTTCTGCAG 7920 

15 GCATAGAAAG ATTAACTGGT TTAGATGGTA AAAATATGAT TTTACGTTCG GCCATTTTAT 7980 

TAACAATCAC GGTTATATTT GCCATTAGTT CATATACAGG ATTGAAAAAA GGTATTCAAA 804 0 

AGTTAAGTGA TATCAACGTT TGGCTATCCT TTGTACTTTT AGCCTTTATA TTTATTATTG 8100 

20 GACCGACTGT TTTTATTATG GAAACGACAG TGACAGGGTT CGGAAATATG TTGAGAGATT 8160 

TCTTTCATAT GGCAACATGG TTAGAACCAT TCGGTGGTAT TAAAGGTCGA AAAGAAACGA 8220 

ATTTCCCACA AGACTGGACA ATATTCTACT GGTCATGGTG GTTAGTATAT GCGCCATTTA 8280 

TCGGTTTATT TATCGCTAGA ATTTCAAAAG GTCGAGGCCT TAAAGAAGTC GTGCTAGGAA 8340 

CAATTATTTA TGGAACGCTT GGATGCGTAT TATTCTTTGG TATTTTTGGT AACTATGCTG 84 00 

TGTATTTACA AATTTCTGGA CAGTTTAATG TAACACAATA TTTAAATACA CATGGTACAG 84 6 0 

AGGCAACCAT TATTGAAGTG GTGCATCATT TACCATTCCC ATCATTGATG ATTGTACTAT 8520 

TCTTAGTATC TGCTTTCTTA TTCTTAGCAA CAACATTTGA TTCGGGTTCA TATATTTTAG 8580 

CGGCAGCATC TCAGAAAAAA GTGGTAGGCG AACCATTACG TGCCAATCGT TTATTCTGGG 8640 

CATTTGCATT GTGCTTATTG CCATTTTCAT TGATGCTAGT TGGTGGTGAA CGTGCATTAG 8700 

AAGTATTGAA AACTGCTTCA ATACTGGCAA GTGTGCCATT AATTGTTATT TTTATTTTCA 8760 

40 TGATGATATC ATTTTTAATC ATTTTAGGGC GCGATAGAAT TAAACTTGAA ACGCGTGCTG 8620 



25 



30 



35 



AAAAATTAAA AGAAGTTGAA CGTCGTTCAT TGCGAATCGT TCAAGTATCa GAAGAAGAAC 8880 

AAGACGATAA TTTATAATTC AAAGCGGGTC TGGGACGACG AAATGaATTT TGTGAAAATA 894 0 

45 TCATTTCTGT TCCaTTCCCC TTTTTTTAGT AGCATTGTAG GATGAACTTT TAGGTTTTCA 900 0 

TTAATGTTGT ACTAAAAGAT TTAATTTTTT AGTGCTCCAA GTACTTATTT ATTGTATGAA 9060 

G CAT ATT CT A AATCGAAGTT TGAAAGACTC TCATTGATTA TTAAATTAAA TAAAGGGTAT 912 0 

SO 

GCGTATGTAC AATTCAAATT AATCGAAGGA TGAAATAAAA TGACTAATCA ATTTAAAAAT 9180 

AAACAGTCCA AATTACATGA CAGTTTAGAA TCCATCACAA AAAACTTATA TGCGACACCT 924 0 
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ACAGAATATT GTTATCTATC ATTCCGGACA CTTAGGTGAC TCCCAACAAG ACATTGCATC 93 60 

ATTAGGTGGT GTTTCAAAAG TATTGATGAA TCATGATCAT GAATCTATAG GAGGTTCTAA 94 20 

TCAAGTTGAA GCCCCTTACT TTATACATGA AAATGATGTG GCTGCACTGA AACATAAGAT 94 80 

TTCTGTTCAA AAACAATTTA GTAATCGTGT AATGTTGGAT AAGGATTTAG AAGTTATTCC 9540 

CGCGCCTGGA CATACACCAG GGACGACACT ATTTTTATGG GATGATGGTC ATCACCGTTA 9600 

CTTATTTACT GGAGATTTTA TATGTTTTGA AGGGAAGAGA TGGCGTACAG TTATATTAGG 96 60 

TTCAAGTGAT AGAGAAAAAT CTATTCAAAG TTTAGAGATG GTTAAAGAAT TAGATTTTGA 9720 

TGTACTTGTA CCTTGGGTTA CTATCAAAGA TGAACCGTTA GTTTATTTTG TAGAAAATGA 9780 

ATATGAAAAA CGTGAACAAA TACAAAATAT TATTGATAGA GTACGTGAGG GCGAGAATAG 9840 

CTAATTGAAA TATATTGGCG AAgCAATGTA ACGAATCTAA GAAAGCCCTA GAAAATACCT 9900 

CCATAATTGA TTGTCATATA AAACAAAAAC GGTAATTTCT ATTTATTGAG ATAGAAATTA 9960 

CCGTTTATTT CGTGGACCTA TTGCATTGTT TTTATCATGC ATAATCATCA TTGTCGTTGT 10020 

TTGAGTCAAT TTTAATTTTC AGAATCAGAA GGCTGTTCTG GAATTGGGAA ATATTTGAAA 10080 

ATTTCACCGC TTTCAATCGC TTCGGTTAAC TGTTCTAACC ATT CGTAATA AACATGTGTA 10140 

TGATCAAGCT GAGCTTTAAT TTTTTGTGCC TCTTGTGTTT CAGCTTCAGT TAAATCACTG 10200 

CTTTCAAGTA ATGGATTGAT AATAGCTTGA GCATCTTTTA CTGCTTCGAC ATTGATGTCA 10260 

ATTTCACGCT GGAATTTTTT AGTGAAAAAG TTTCGGAAAA AGATGAAAAA GTCTTTCTCG 10320 

GCGATAAAAT GTTGTTTGCG GCTTCCTCTC GTAAATTGTT GTTTAACAAT ATCAAATTCC 103 80 

TGCAATTTCT TAACGCCAGC ACTCATACTT GGTTTGCTCA TTTGCAATTG ATGACGCATT 10440 

TCATCAAGCG TCATACTGCC TTCAAACACC ATTGTGCCAT ATAAGTTTCC TACACTTCTA 10500 

TTAGTGCCAT ACAAATCCAT TGTCTGTCCA ATTGAATTAA TTACAATATC TTTTGCTTGT 10560 

TCTAATTGTT GCTGTTTGTT CTGAGAACGA GTCATCATTG CACCTCCGTA CATCATTTTG 10620 

GTCACGTTAA AATAAATACT AATACATTAT AAAACCTTTT CTAAAAAAAG ACATTAAAAA 10680 

TATTTAAAGC ATTAAAGTTA AATGTTTCGT TAAATAAAAA TCTAACGAAC TTACAAAACT 1074 0 

TAATTCTTGA GTTGTTTTGT AAATTGACAC ATTTTTCATT TCTATGCTAA CATAAGTnTG 10800 

TAAAATTcGT TAAATAAAAA TTTAACAAAC TTAACGGrGG TTGTTGAAkG GrACTTTTAA 10860 

aACATTT AT C TCAGCGTCAA TATATTGATG GTGAGTGGGT TGAAAGCGCG AATAAAAATA 10920 

CAAGAGATAT TATCAATCCT TACAATCAAG AAGTGATATT TACGGTTTCT GAAGGGACAA 10980 

AAGAGGATGC AGAACGTGCA ATCTTAGCTG CAAGACGTGC GTTTGAGTCT GGTGAATGGT 11040 



55 



677 



EP 0 786 519 A2 

AACATCgCGA AgCgTTAGCA CGATTAGAAA CATTAGATAC TGGAAAAACG TTAGAAGAAT 11160 

CAT ATG CAGA TATGGATGAT ATTCATAATG TGTTTATGTA TTTTGCTGGA TTAGCAGATA 11220 

5 

AAGACGGTGG CGAAATGATT GATTCACCAA TTCCAGATAC AGAAAGCAAA ATTGTTAAAG 112 80 

AACCAGTAGG TGTAGTTACA CAAATTACAC CTTGGAATTA TCCGTTATTA CAAGCATCAT 1134 0 

GGAAAATTGC GCCAGCGCTT GCTACGGGTT GTTCACTAGT TATGAAACCA AGTGAAATTA 114 00 

w 

CACCATTAAC AACAATACGT GTTTTTGAAT TAATGGAAGA AGTTGGTTTC CCTAAAGGAA 114.60 

CAATTAATCT TATTCTAGGT GCAGGTTCTG AAGTTGGTGA CGTAATGTCA GGTCATAAAG 11520 

1S AGGTTGACCT TGTATCATTT ACAGGTGGCA TTGAGACTGG TAAGCATATT ATGAAAAATG 11580 

CTGCTAATAA TGTTACGAAT ATTGCCTTGG AACTTGGCGG TAAAAATCCA AACATTATCT 11640 

TTGATGATGC TGATTTTGAA TTGGCAGTAG ACCAAGCGTT AAATGGTGGA TATTTCCATG 11700 

20 CAGGTCAAGT TTGTTCAG CA GGATCAAGAA TATTAGTACA AAACAGTATT AAAGACAAAT 11760 

TTGAGCAAGC ACTTATTGAT CGCGTGAAAA AAATCAAATT AGGTAATGGT TTTGATGCTG 11820 

ATACTGAAAT GGG AC C AG TG ATTTCAACAG AACATCGTAA TAAGATCGAA TCTTATATGG 11880 

25 ATGTAGcTAA AGCAGAAGGC GCAACAATTG CTGTTGGTGG TAAACGTCCA GATAGAGATG 11940 

ATTTAAAAGA TGGTCTATTC TTCGAGCCAA CAGTCATTAC AAATTGTGAT ACGTCAATGC 12000 

GTATTGTACA AGAAGAGGTT TTCGGACCTG TCGTTACTGT AGAAGGCTTT GAAACTGAAC 12 060 

30 

AAGAAGCGAT TCAATTAGCG AATGATTCTA TATATGGTTT AGCAGGTGCT GTATTTTCTA 1212 0 

AAGATATTGG AAAAGCACAA CGCGTTGCTA ACAAGTTGAA ACTTGGAACG GTGTGGATTA 12180 

ATGATTTCCA TC CAT ATTTT GCACAAGCGC CATGGGGTGG ATACAAACAA TCAGGTATCG 12240 

3S 

GTAGAGAATT AGGCAAAGAA GG CTTAGAAG AGTACCTTGT TTCAAAACAC ATTTTAACAA 12 3 00 

ATACAAATCC ACAATTAGTG AATTGGTTTA GCAAATAAAA ATTAGATAAG GTGAGTGCCA 12360 

40 TTGTAAGAAC ACAAGACACT CACTTT G TTT TGTATAA GTG GCGAAATGTT GATTGATAAT 124 20 

TTGGACTAAA CGCAAAATGA ATCATAGATT ATTTCATTAC TGTTAGTAAC AATCGTAAAA 12480 

GGAAAAGCGA GTGTTTTGGT TAGCTAAGTT TAGCAATTCA ACGATAACCA ATCAGCCACT 12 540 

45 AACAAATATT TCATGCAATA CTCACTTTGA AATACAACAA ACTTTGGAGG TCATAACGAT 12600 

GAGTAACAAA AACAAATCAT ATGATTATGT CATCATTGGA GGAGGCAGTG CAGGTTCTGT 12660 

ACTAGGTAAT CGTCTGAGTG AAGATAAAGA TAAAGAAGTC TTAGTATTAG AAGCGGGTCG 12720 

SO 

CAGTGATTAT TTTTGGGATT TATTTATCCA AATGCCTGCT GCGTTAATGT TCCCTTCAGG 12780 

CAATAAATTT TACGATTGGA TTTATTCAAC AGATGAAGAA CCACATATGG GCGGTCGTAA 12840 
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TCAACGTGGT 


AATCCAATGG 


ACTATGAAGG 


CTGGGCAGAA 


CCAGAAGGTA 


TGGAAACTTG 


12960 


GGATTTTGCG 


CACTGTTTAC 


CGTATTTTAA 


AAAATTAGAA 


AAAACATACG 


GTGCAGCGCC 


13020 


TTATGATAAA 


TTTAGAGGCC 


ATGATGGACC 


AATTAAGTTA 


AAACGAGGGC 


CAGCAACGAA 


13080 


TCCTTTATTC 


CAGTCATTCT 


TTGATGCAGG 


TGTTGAAGCA 


GGCTATCATA 


AAACACCTGA 


13140 


TGTGAATGGA 


TTTAGACAAG 


AAGGTTTTGG 


ACCGTTCGAT 


AGTCAAGTAC 


ATCGTGGTCG 


13200 


CCGAATGTCA 


GCTTCAAGAG 


CATATTTACA 


TCCAGCGATG 


AAGCGTAAAA 


ACTTAACCGT 


13260 


TGAAACACGT 


GCCTTTGTAA 


CTGAAATTCA 


TTATGAAGGT 


AGAAGAGCAA 


CTGGTGTTAC 


13320 


GTATAAGAAA 


AATGGCAAAC 


TACATACCAT 


CGATGCTAAT 


GAAGTCATTT 


TGTCTGGTGG 


13380 


GGCATTCAAT 


ACGCCACAAT 


TACTACAATT 


ATCTGGTATC 


GGTGATTCAG 


AGTTCCTAAA 


13440 


ATCAAAAGGC 


ATTGAGCCAC 


GTGTTCATTT 


ACCTGGTGTG 


GGTGAAAACT 


TTGAAGATCA 


13500 


CTTAGAGG 












13508 


(2) INFORMATION FOR SEQ ID NO: 121: 








(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7646 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS ; double 

(D) TOPOLOGY: linear 






\ 


(Xi) SEQUENCE DESCRIPTION : SEQ ID NO; 121: 






GTAAGTATTG 


TCTTGATTTC 


CTAATAAAGT 


TATATCTTGT 


AATTCATCTT 


GTTGACGGCC 


60 


ATGTGCCATA 


TAAAGCGCTC 


CTTTAAATTT 


ATrriTlTAT 


TATTTTGGCG 


TCTCGGCGTG 


120" 


CTTTTTCAAA 


CATGTAATAA 


CTTGCACCGA 


TAATAACGAC 


GTAAC CTAAT 


GTTGCATAGA 


180 


AATCSGGAGA TTCTCCGAAT 


AGAATAAATC 


CAAGTATTGC 


TGTGAAAATT 


ATAGATGCAT 


240 


ACGTAAAAAT 


AGAAATATCT 


TTTGCTGCTG 


CAAAACTATA 


TGCTAAAGTA 


ACACCAATTT 


300 


GACCCACAGC 


GGCAgCTAAG 


CCAGCCCCTA 


ATAGATAAAG 


TATTTGCATC 


TGACTCATTG 


360 


GTTCATAAGT 


ATATGCAGTG 


AAAGGTATTA 


AAACGATGAC 


AGAAAATAAG 


GAGAAGTAAA 


420 


ATACTATAGT 


ATATGGTGCT 


TyTCTTGTAC 


TAAGTGCTCG 


AACACATGTA 


TATGCTGATG 


480 


CTGCAAAAAT 


ACCTGAGAAT 


AAGCCAGCTA 


ATGATGGAAT 


CATAGATGAT 


GAAAATTCAG 


540 


GTTTCACTAT 


TAAnAGCAaC 


CTAAAATAGC 


AATTATCATT 


GCTGTAATTT 


GaTACTTCCT 


600 


TACCTTTTCA 


TGtAAGAaaA 


CAATGCTTaA 


TAAAATCGTC 


CAGAAAGGAT 


TGAGTTTCAT 


660 


TAATGAATCG 


GCATCACTAA 


GTACCATATG 


ATCAATGGCA 


TAAATATTTA 


ACAATACACC 


720 
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TGGCTGATGG TATTTATATA TAAAAAATAA TGGAATAAAC ATTGCTACTA AGTTTCGTG C 84 0 

TAATGATTTT TGAAAAACAG GAAGGTCACC TGCAAGTCTG AAAAACACTG ACATAAAACT 900 

GAAACCAATA GCCGAAATTA AAATGGCAAT GATACCTTTT ACTTTAGGAT TCAATTTTAT 960 

CGCCTCTTTT ATATAAAATT AACGTATTTA TATTAGCATA AAACAACATG TTGTGCATAA 102 0 

ATAGTTGAAA TTTACTATAA AAAGACTATA ATAGACTGTA GCGAACAAAC GTTCTGTGTT 1080 

TATTTGTCGG AATAATAGGG CATTACACTT TTATGAATGT TTGTGTTATT ACATAAAACA 114 0 

AATATCAATT CAGTATCAAG CTAATAAGCT TTTTCTTGAT TTCTGTTGAT ACAATTGAGA 1200 

TTGACACAGA TTTAAAAAAA TCAAGTGATA TCTACTAAAA AATTTTTTTA AATTTGTTCA 1260 

AGTTTTTCTA ATTTAGTATT GGTGC CTAGT TGGAACGTTT TACGAACATT CGATTAGAAA 1320 

ATGGCACTTT AAATCATAGT GTGTCTTATG TATAATGAAA CACATAATAT AGTGTTGGTG 1380 

AAACGAAAAA gACACAATAT CTTGTGTTTT GTATGCAAAT GCTTTATTTA TGAAGAAATT 144 0 

ACATTTAAAA GTAATTTAAC ACAGAAATTT AATAGTTATT AT CAATT AAT AGT CATATTT 1500 

TTAGAAAATG TACTGAGCAA ATGGAAGATA TCCAATGATG TAAACACTAC ATATAGTGAT 1560 

TTTTATACAT TCAACCCATA TAAGCTACTA TTTTCTCAAA TATAAATCTA TGCAATTGGT 162 0 

TTACATTTGA GAAAATAAGT AGCTTCATTA TAG TT AAT AC AATGCTGAGA TAAC CATAGT 1680 

AAC CATGTTG TTAAAGCATT TTTTAATTGG AATGACTACT TTATTTAAAA GGGTTGAAGA 174 0 

AAGAAGGTGA TCCAATGAAA ATAATATATT TTTCATTTAC TGGAAATGTC CGTCGTTTTA 1800 

TTAAGAGAAC AGAACTTGAA AATACGCTTG AGATTACAGC AGAAAATTGT ATGGAACCAG 1860 

TTCATGAACC GTTTATTATC GTTACTGGCA CTATTGGATT TGGAGAAGTA CCAGAACCCG 1920 

TTCAATCTTT TTTAGAAGTT AATCATCAAT ACATCAGAGG TGTGGCAGCT AGCGGTAATC 1980 

GAAATTGGGG ACTAAATTTC GCAAAAGCGG GTCGCACGAT ATCAGAAGAG TATAATGTCC 204 0 

40 CTTTATTAAT GAAGTTTGAG TTACATGGAA AAAACAAAGA CGTTATTGAA TTTAAGAACA 2100 

AGGTGGGTAA TTTTAATGAA AACCATGGAA GAGAAAAAGT ACAATCATAT TGAATTAAAT 2160 

AATGAGGTCA CTAAACGAaG AGAAGATGGA TTCTTTAGTT TAGAAAAAGA CCAAGAAGCT 2220 

TTAGTAGCTT ATTTAGAAGA AGTAAAAGAC AAAACAATCT TCTTCGACAC TGAAATCGAG 2280 

CGTTTACGTT ATTTAGTAGA CAACGATTTT TATTTCAATG TGTTTGATAT TTATAGTGAA 234 0 

GCGGATCTAA TTGAAATCAC TGATTATGCA AAATCAATCC CGTTTAATTT TGCAAGTTAT 24 00 

ATGTCAGCTA GTAAATTTTT CAAAG ATTAC GCTTTGAAAA CAAATGATAA AAGTCAATAC 24 60 

TTAGAAGACT ATAATCAACA CGTTGCCATT GTTGCTTTAT ACCTAGCAAA TGGTAATAAA 2520 
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ACATTTTTAA ACGCAGGCCG TGCGCGTCGT 
GTGGATGACA GCTTAAATTC AATTAACTTT 

5 

ATTGGGGGCG GCGTTGCAAT TAACTTATCT 
GGAATTAAAG GCGTAgCGAA AGGCGTTTTA 
AGCTATGCAG ATCAACTTGG TCAACGCCCT 

10 

CATTATGATG TAGAAGAATT TTTAGATACT 
TTATCTACAA TATCAACTGG TTTAATTGTT 

1S GGTAAGGACT TTTATATGTT TGCACCTCAT 

GACGATATCG ATTTAGAAAA ATATTATGAT 
AAGAAAAAGA ATGCGCGTGA AATGTTGAAT 

20 TATCCATATT TAATGTTTAA AGATAATGCT 

CAAATTAAAA TGAGTAACTT ATGTACGGAA 
AATGACTATG GTATTGAAGA CGAAATTAAA 

25 AATATTGTTA ATGTAATGGA AAGCGGAAAA 

GCATTAACTG TTGTGAGTGA TGTAGCAAAT 
AACAGTGAAT TACATTCAGT TGGT CTTGGT 

30 

AATAAAATTG GTTATGAGTC AGAAGAAGCA 
ATGAATTTCT ACTCAATCGA ACGTTCAATG 
CAAGACTTTG AAAAGTCTGA TTATGCTAAT 

3S 

GAATTTGAAC CTCAATTCGA AAAAGTACGT 
TCTGAGGATT GGAAGAAACT ACAACAAGAT 

40 AGAtTAGCAA TTGCTCCAAC ACAAAGTATT 

ATGCCAATCG TTGACCAAAT TGAACGTCGT 
ATGCCATTCT TATCACCACA AACAATGTGG 

45 ATGAAATTAA TCGATTTAAT TGCGACAATT 

ATCCTTTATG TTAATTCTGA AATTTCTACA 
CACTATAAAG GATTAAAATC ACTTTACTAT 

SO 

TGTACAAGTT GTTCTATCTA ACAATTAAAT 
TCTGAATTAG CAGATGATTA GACTGCTATG 

55 



GGTGAGCTAG TGTCATGTTT CTTATTAGAA 264 0 

ATTGATTCAA CTGCAAAACA ATTAAGTAAA 2700 

AAATTGCGTG CACGTGGTGA AGCAATTAAA 2760 

CCTATTGCTA AGTCACTTGA AGGTGGCTTT 2 820 

GGTGCTGGTG CTGTGTACTT AAATATCTTC 28 80 

AAAAAAGTAA ATGCGGATGA AGATTTACGT 2 94 0 

CCATCTAAAT TCTTCGATTT AGCTAAAGAA 300 0 

ACAGTTAAAG AAGAATATGG TGTGACATTA 3060 

GACATGGTTG CAAACCCAAA TGTTGAGAAA 3120 

TTAATTGCGC AAACACAATT ACAATCAGGT 3180 

AACAGAGTGC ATCCGAATTC AAACATTGGA 3240 

ATTTTCCAAC TACAAGAAAC TTCAATTATT 3 300 

CGTGATATTT CTTGTAA<JTT GGGCTCATTA 3360 

TTCAGAGATT CAGTTCACTC TGGTATGGAC 3420 

ATTCAAAATG CACCAGGAGT TAGAAAAGCT 34 80 

GTGATGAATT TACACGGTTA CCTAGCAAAA 3 54 0 

AAAGATTTTG CAAATATCTT CTTTATGATG 3 600 

GAAATCGCTA AAGAG CGTGG TATCAAATAT 3660 

GGCAAATATT TCGAGTTCTA TACAACTCAA 3720 

GAATTATTCG ATGGTATGGC TATTCCTACT 3780 

GTTGAACAAT ATGGTTTATA TCATGCATAT 3 84 0 

TCTTATGTTC AAAATGCAAC AAGTTCTGTA 3 900 

ACTTATGGTA ATGCGGAAAC ATTTTACCCT 3 960 

TACTACAAAT CAGCATTCAA TACTGATCAG 4 020 

CAAACGCATA TTGACCAAGG TATCTCAACG 4 080 

CGTGAGTTAG CAAGATTATA TGTATATGCG 414 0 

ACTAGAAATA AATTATTAAG TGTAGAAGAA 4 200 

GTTGAAAATG ACAAACAGCT AATCATCTGG 4 260 

TCTGTATTTG TCAATTATTG AGTAACATTA 4320 
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ATGTTTTGGA GACAAAATAT ATCTCAAATG TGGGTTGAAA CAGAATTTAA AGTATCAAAA 4440 

GACATTGCAA GTTGGAAGAC TTTATCTGAA GCTGAACAAG ACACATTTAA AAAAGCATTA 4500 

5 GCTGGTTTAA CAGGCTTAGA TACACATCAA GCAGATGATG GCATGCCTTT AGTTATGCTA 4 560 

CATACGACTG ACTTAAGGAA AAAAGCAGTT TATTCATTTA TGGCGATGAT GGAGCAAATA 4620 

CACGCGAAAA GCTATTCACA TATTTTCACA ACACTATTAC CATCTAGTGA AaCAAACTAC 46 80 

70 

CTATTAGATG AATGGGTTTT AGAGGAACCC CATTTAAAAT ATAAATCTGA TAAAATTGTT 474 0 

GCTAATTATC ACAAACTTTG GGGTAAAGAA GCTTCGATAT ACGACCAATA TATGGCCAGA 4 800 

75 GTTACGAGTG TATTTTTAGA AACATTCTTA TTCTTCTCAG GTTTCTATTA TCCACTATAT 4860 

CTTGCTGGTC AAGGGAAAAT GACGACATCA GGTGAAATCA TTCGTAAAAT T CTTTT AG AT 4920 

GAATCTATTC ATGGTGTATT TACCGGTTTA GATGCACAGC ATTTACGAAA TGAACTATCT 4 980 

20 GAAAGTGAGA AACAAAAAGC AGATCAAGAA ATGTATAAAT TGCTAAATGA CTTGTATTTA 5040 

AATGAAGAGT CATACACAAA AATGTTATAC GATGATCTTG GAATCACTGA AGATGTGCTA 5X00 

AACTATGTTA AATATAATGG AAACAAAGCA CTTTCAAACT TAGGCTTTGa ACCTTATTTT 5160 

25 GAGGAACGTG AATTTAACCC AAT CATTG AG AATGCCTTAG ATACAACAAC TAAAAACCAT 5220 

GACTTCTTCT CAGTAAAAGG TGATGGTTAT GTATTAGCAT TAAACGTAGA AGCATTACAA 5280 

GATGATGACT TTGTATTTGA CAACAAATAA CAATTAAATT AAAAGACCTT CACATGTAAA 534 0 

30 

GGGAAATAGC GATTCGTTTC GTCTTGTCTC CTACATGTTG AAGGTCTTTT TTTATGTGTA 5400 

T CT AACT CAT TATGAGTCTG AGTAAGAAAT CAATGCTCTA AGATGTACAA TGCTATTTAT 5460 

ATTGGCAGTA GTTGGCGGGG CCCCAACACA GAAGCAGGCG GAAAGTCAGC TAACAATATT 5520 

35 

GTGCAAGTTG GCGGGGCCCC AACATAGAAG CAGGCGGAAA GTCAGCTAAC AATAATGTGC 5580 

AAGTTGGCGG GGCCCCAACA TAAAAGCAGG CGGAAAGTCA GCTAACAATA TTGTGCAAGT 5640 

40 TCGGgCGGGG CCCCAACATA AAGAAAAACT TTTTCCTTTA GAAATTATCA CTTCCaCaTG 5700 

AGTTTTACTC ATGTATTCCT ATTTTTAAGT ACACATTAGC TGAGGCTAAT GTTAAGAACC 5760 

ACTACTTAAT CAATCATTAG TAGTTTTTAT CATTTCCACT ATTCCCaGAC ATCaAAATCT 5820 

45 TAAGTGTTCT ATTTTACTTT AAGTAAACAA AATACACATT CCGAAAAATT AAATTTCAGT 5880 

TTAATTGCAA ATATCAATAA AATTGACACT AAATTATTTG AAAGGCTATT GAAATTATGG 5940 

TCAAAAAACG CTACTATTAA TGAGAAATAT TATCAATGAT AATGATTATC ATTAATTTAA 600 0 

SO 

AGGGAGAAAA ATTTGTAATG AAGTATTTAT TAAAGGGAAA TATTTTGCTT CTATTACTAA 6060 

TATTGTTGAC AATTATTTCG TTGTTCATAG GTGTGAGTGA ACTATCAATT AAAGATTTAC 6X20 
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GTATTTTAAT TGCTGGAAGT TCGTTGGCTT TAGCAGGCTT GATAATGCAA CAAATGATGC 624 0 

AAAATAAGTT TGTTAGTCCG ACTACAGCTG GAACGATGGA ATGGGCTAAA CTAGGTATTT 6 300 

TAATTGCTTT ATTGTTCTTT CCAACCGGTC ATATTTTATT AAAACTAGTA TTTGCTGTTA 6 360 

TTTGCAGTAT TTGCGGTACG TTTTTATTTG TTAAAATCAT TGATTTTATA AAAGTGAAAG 6420 

ATGTCATTTT TGTACCGCTT TTAGGAATTA TGATGGGTGG GATTGTTGCA AGTTcACAAC 64 80 

CTTCATCTCA TTGCGCACGA ATGCTGTTCA AAGCATTGGT AACTGGCTTA ACGGGAACTT 6 54 0 

TGCCATTATC ACAAGTGGAC GCTATGAAAT TTTATATTTA AGTATTCCTC TTTTAGCATT 6 600 

GACATATCTT TTTGCTAATC ATTTCACGAT TGTAGGAATG GGTAAAGACT TTACTAATAA 6660 

TTTAGGTTTG AGTTACGAAA AATTAATTAA CATCGCATTG TTTATTACTG CAACTATTAC 6720 

AGCATTGGTA GTGGTGACTG TTGGAACATT ACCGTTCTTA GGACTAGTAA TACCAAATAT 6 780 

20 TATTTCAATT TATCGAGGTG ATCATTTGAA AAATGCTATC C CT CATACGA TGATGTTAGG 6 84 0 

TGCCATCTTT GTATTATTTT CTGATATAGT TGGCAGAATT GTTGTTTATC CATATGAAAT 6 900 

AAATATTGGT TTAACAATAG GTGTATTTGG AACAATCATT TTCCTTATCT TGCTTATGAA 6 960 

AGGTAGGAAA AATTATGCGC aACAATAATA AAAAAATAAT GCTTTTAATT GCAGTAACGT 7020 

TATTAATTAG TATGCTGTAC TTATTTGTAG GTATTGATTT TGAAATATTT GAATATCAAT 70 80 

TTTCAAGTCG TTTAAGAAAG TTCATATTAA TTATTTTAGT AGGTGCTGCC ATTGCAACTT 714 0 

CAGTGGTGAT TTTTCAAGCG ATTACAAATA ACCGTCTATT GACACCATCA ATAATGGGGT 7200 

TAGATGCAGT TTATTTATTT ATCAAAGTAT TGCCAGTCTT TTTATTTGGA ATTCAATCGG 7260 

TATGGGTTAC TAATGTATAT TTGAACTTTA TATTAACACT TATAACGATG GTGTTATTCG 73 20 

CACTAATCCT ATTCCAAGGT ATCTTTAAAA TCGGACATTT TTCAATTTAT TTTATCTTAC 7380 

TTAJTGGTGT CCTTTTAGGA ACATTTTTTA GAAGCATAAC AGGTTTTATT CAACTGATTA 744 0 

TGGATCCTGA GTCATTTTTA GCAATACAAA GTAGTATGTT TGCTAATTTT AATGCTTCTA 7500 

ATTCGAATTT AGTTACTTTC TCAGCAGTGC TATTAGTAAT CTTATTAGTC ATTACAATTT 756 0 

TACTATTGCC TTATTTAGAT GTATTG CTTT TAGGTCGTGC TGAAGCAATT AATCTTGGGA 762 0 

45 TATCGTATGA AAAATTAACG CGAATT 764 6 

(2) INFORMATION FOR SEQ ID NO: 122: 

(i) SEQUENCE CHARACTERISTICS: 
SO (A) LENGTH: 1194 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 122: 

ATGAATATAT TTnnAAATAA ATTATTATGG ATTGCACCAA TnGCCACTAT GATTATCTTG 60 

GTAATCTTTT CTTTAGCTTT TTATCCTGCA TATAATCCTA AACCAAAAGA TTTACCAATT 120 

GGTATATTAA ACGAGGATAA AGGTACAACG ATTCAAGATA AAAATGTTAA CATTGGTAAA 190 

AAATT AG AGG ATAAATT ATT AGATAGTGAT TCTAATAAAA TTAAATGGGT TAAGGTTGAT 24 0 

AGTGAAAAAG ACCTTGAAAA AGATTTGAAA GATCAAAAAA TCTTTGGAGT AGCTATTATT 300 

GATAAAGACT TTTCAAAAGA TGCTATGAGT AAAACACAAA AAGTAGTTAT GGATAGTAAA 360 

AAAGAAGAAA TGCAACAAAA AGTTGCTTCA GGTGAAATTC CGCCACAAGT GGTTCAACAA 420 

ATGAAACAAA AAATGGGGAA TCAACAAGTA GAGGTTAAGC AGGCTAAATT TAAAACGATT 4 80 

GTAAGTGAAG GATCAAGCTT ACAAGGTTCA CAAATTGCAT CAGCTGTGTT AACTGGTATG 540 

20 GGTGATAATA TTAATGCTCA AATTACGAAG CAAAGTTTGG AAACATTAAC GAGTCAAAAT 600 

GTTAAAGTCA ATGCCGCGGA CATCAATGGT TTGACGAATC CAGTAAAAGT GGATAATGAA 660 

AAACTTAATA AAGTTAAAGA TCACCAAGCA GGTGGTAATG CACCATTCCT AATGTTTATG 72 O 

CCAATTTGGA TAGGTTCAAT CGTAACGTCT ATCTTATTGT TCTTTGCATT TAGAACTAGT 780 

AACAATATCG TCGTG CAACA TCGTATCaTT GCtTCAATTG GACAGATGAT ATTTGCAGTT 84 0 

GTTGCAGCAT TTGCAGGTAG CTTTGTTTAT ATTTATTTCA TGCAAGGCGT TCAAAGATTT 900 

GATTTTGACC ATCCAAATCG TATCGCAATT TTTGTAGCAT TTGCGATTCT TGGTTTCGTG 960 

GGCCTTATTT TAGGTGTTAT GGTATGGCTA GGTATGAAGT CAGTTCCAAT TTTCTTCATT 1020 

TTAATGTTCT TTAGTATGCA ACTTGTAACG TTACCTAAAC AAATGTTGCC TGAAAGTTAT 108 0 

CAAAAATATG TATATGATTG GAATCCATTC ACACACTATG CAACAAGTGT AAGAGAC TAT 1140 

TATACTTGAA TCATCATATT GAATTAAATA GTACAATGTG GATGTTTATA GGGT 1194 
^ (2) INFORMATION FOR SEQ ID NO: 123: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 558 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
45 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 123: 
GACCGACCTA TACATCCGTA TAAGTATTTC TTGATATAAG TCTTCTAAAT CATAATGATT 60 
AAATCCAAAT GTTTTGATGC GTCGAATAAT TAATGGTTGT AGATCCATTA CTAACTTTTC 120 
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GTATTTCAAA TATTAAACTA ACCCCTTCTA TCTAAAATTT AAGGTTAGTT TAATATTGTT 24 0 

ACATTCAAAA TTTCAAGATG ACGGAAATGT CATTTCTTAT GATGTCCTCT TCGTATTTTT 300 

TCAAATTCTG CAAGGATTTC AGAAGATAAC GGAATTCGAG TTCTTGGCTT GTTTTCACTT 360 

ATATCATCTA ATGATTTACT CACATCAATT TCATTTTCTT TTAAATCTCT CCACATTTCG 4 20 

CGAGATGATA TTCTATATGC ACCTGATCCA AAGATAGCAT GTTGcTCACT CaTATCACTT 4 80 

GTTACAACTG TAATATGcTT AG t ATGCTTG tCaTAAAGtT CaTAAACCAT AACGGTTCTA 54 0 

ATGGAAACCA ATCAGCTG 558 
(2) INFORMATION FOR SEQ ID NO: 124: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7762 base pairs 

(B) TYPE: nucleic acid 

( C ) STRANDEDNESS : doub 1 e 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 124: 
25 GCTTCAGACA TnTGATGATA TAATCTCTCA TCATCGATTA ATTCTTTTGC AGCTTGATAC 60 

ACATnTTGCT TATTTGTTCC AATGACTTTT AATGTGCCAG CTTCAACACC TTCAGGACGT 120 

TCTGTAACAC TTCGCCAAAA CTAAAACTGG CTTATTAAAT GATGGCGCTT CTTCCTGAAT 180 

TCCACCTGAA TCTGTCAAAA TAAAATAAGA TTTTnTAGCA AAATTATGGA AAT CTATACG 240 

TCCAAAGGTT CAATCAATTC AATTCTGTCA TGACTACCTA AAATCTTTTG AGCCACCTCT 3 00 

CGAACTTTCG GGTTTTTATG CATTGGATAT ACCAGTGCTA AATCAGTATA CTCATCTATT 360 

AAGCGTCTAA CCGCTTTAAA TATATTTTCC aTGGGTTTCC CGATATTTTC TCGTCGGTGT 420 

GCTGTCATrA GAATGAATTT kTtGTCATGG TATTTATCCA TGATGTTAGA TTTATAATTG 4 80 

TCATCAACTG TATATTTCAT AGCATCAATC GCAGTATTAC CAGTGACAAC AACACTTTCT 540 

GAATATTTCC CTTCACTTAA CAAATGCGAT GCAGCATTTT TAGTAGGTGC AAAATGTAAG 600 

TCAGCTAATA CACCAACTAA TTGTCTATTC ACCTCTTCTG GAAAAGGTGA ATATTTATCA 660 

TAACTTCTAA GCCCTGCTTC AACGTGTCCA ATCGGCACTT GGTTATAAAA TGCCGCTAAA 720 

CCACCTGCAA ATGTCGTCAT CGTATCACCA TGTACAAGTA CCATGTCTGG TTTTTCTAAT 780 

TGAATCACTT GTTCTAATTG AGTGATTGAT TTAGAAGTTA TCTCAGAAAG TGTCTGTCCT 84 0 

50 GATTTCATAA TATTCAAATC GTATTTTGGT TTGATTTCAA AGGTACTTAA TACTGAATCA 900 

AGCATTTCTC TATGCTGTGC TGTAACAACA ACAATTGGCT CGAGCATTTT TTCTTGTTCC 960 
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ATCTTTTTCA TCAAACTACT TATCTCCGAT TCTTCTATTT AGTACCAAAC AATCTATCTC 1080 

CAGCGTCGCC TAACCCTGGT GTGATATATG CTTTGTCATT aGCTTTTCAT CAAGTGCAGC 1140 

AATATAAATA TCTACATCTG GATGTGCTTC ATGCATCTTT TCTACGCCTT CTGGTGCTGC 1200 

AATTAAACAC ATGAAGCGAA TATTTTTAGC GCCACGTTTC TTCAATGAAG TAATAGCTTC 1260 

AATTGCTGAT GCGCCTGTTG CTAACATAGG ATCAACAACA ATGATTTGTC TTTCAGTAAT 1320 

ATCTTGAGGT AACTTAGCAA AATACTCTAC AGC CTTTAAT GTTTCGGGAT CTCGATATAA 13 80 

ACCGATATGT CCAACTCTGG CTGCAGGTAC TAAACTTAAA ATACCATCAG TCATACCTAA 144 0 

ACCAGCTCTT AAAATTGGAA CGATAGCTAA TTTTTTACCA GCTAATCGTT TAGCCGTCAT 1500 

TTTAGTTACA GGCGTTTCAA TATCAACATC CTGAAGCTCT AAGTCTCTAG TTACTTCATA 1560 

TGCCATCAAC ATACCAACTT CGTCTACAAG TTCTCTAAAT TCTTTAGTAC CTGTATTTAC 1620 

ATCTCTAATA TAGCTTAGTT TGTGTTGAAT TAATGGATGA TCGAAAACGT GTACTTTACT 1680 

CATAAAAATT ACTCCTATCT TTGTGTATGT TTATTGATAT AGAGGATATT CAGCTGTTAA 174 0 

TTTCGCAACG CGTTCTTTAG CTTGTTGTAA TTTTTCTTCA TCTTTACTAT TTTTCAATGC 180 0 

25 TAAACTGATG ATTTTTGCAA CTTCCTCAAA AGCTTTTTCA TCAAATCCAC GCGTTGTTGC 1860 

AGCAGGTGTA CCTAAACGTA TACCACTCGT TACAAAAGGT TTTTCTTGAT CGAACGGAAT 1920 

GGTATTTTTG TTACATGTGA T AC CAACTG A ATCTAAAGTC TCTTCAGCTT CTTTACCAGT 198 0 

30 AAGTCCTATA GACCCTTTTA CATCAACAGC TACTAAGTGA TTAT CTGT AC CGCCAGAAAC 204 0 

AATT CTAAAT CCTTCATTAA TTAATGCTTC TGCAAGAACT TTTGCGTTTT TAACCACTTG 2100 

TTGTTGATAC GTTTTGAAAT TATTTTCTAA CGCTTCTCCA AAAG CAACTG CTTTtGCTgC 2160 

AATAACATGC TCAAGAGGTC CACCTTGAAT ACCAGGGAAA ATTGTTTTAT CTATGTCTTT 2220 

TTTATATTCT TCCTTACATA AAATCATACC ACCACGtGGT CCGcGTAATG TTTTGTGTGT 2280 

TGTAGTTGTT ACAAAATCAG CATATTCTAC TGGATTTGGA TGTAAACCTG CCGCTACTAA 2340 

"TCCTGCAATA TGTGCCATGT CTAC^TTAA" "CTTAGCGTTT ACTTCATCrc~CGATTTCTTT 2400" 

AAACTTTTTG AAGTCAATTG TTCTTGAATA TGCTGATGCT CCTGCCACAA TAAGCTTAGG 2460 

CTTATGCTCT AACGCTAATT TACGAACTTC AT CAT AATTG ATTCGTTCTG TGTCTTTATC 2520 

TACTCCATAT TCAACGAAAT TGTAGAATTT ACCACTAAAA TTAACAGGCG CTCCATGTGT 2580 

CAAGTGACCA CCATGACTCA AATTCATACC TAAAACTGTG TCGCCCATTT CTAATGCAAC 2640 

SO TAAGTAAACA GCCATGTTCG CTTGTGAACC TGAATGTGGT TGAACATTGA CATGTTCAGC 27 00 

TCCAAACAAT GCTTTAGCAC GATCAATTGC GATGCTTTCA GTAACATCTA CAAACTCACA 2760 
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TTGTGCTTCC ATAACCGCTT CCGATACAAA ATTTTCCGAT GCGATTAACT CTATGTTGCT 2880 

ATTTTGTCTC TGAAATTCTC TCTCGATTGC TTCTGCGATA ACTTTATCTT G CTTGGTG AT 2940 

5 ATAAGACATA AAATCTCCCC TTCTTTCAAA AAAACTTATT GGTATTTAGC ACGTTCGCCA 3 000 

CCAATCTTTT TCGGCCTAGA TGTGGCAATA GTTACAATTG CCTGTCCTAC TTGCTTTACT 3060 

GAGGTCCTTA CAGGTACACA TACATGTTTA ATATGCATGC CTATTAACGT TTGACCAATA 3120 

w 

TCAATTCCAC AAGGAACAGT AATATGTTCG ACCACGATCG GATCCTTCAT ATGCTGAAAA 3180 

GCGTATGTTG CCAAACTCCC TCCAGCATGT ACATCTGGAA CGACGGAAAC TTCTTCCATT 324 0 

GTTAATGGAT TATACTGAGA TTTTTCTATT GTTATCGCTC TGTTGATATG TTCACATCCT 3300 

75 

TGAAAAGCAA AAGTAACGCC TGTCTCTTTA CTCACAACAT CTAATGCATT AAAAATAGTT 3360 

TCTGCAACTT CCaTCGAACC GACAGTCCCT ATTTTTTCGC CAATGACTTC CGATGTTGAA 3420 

CATCCAATTA AACATATATC TCCTTTATTA AAAAAGGACA TATCTTTTAA TTCGTCTAAT 34 80 

20 

AAGATTGTCA AATCTTTCAT AAAAGCCCAC CCTTCCTAAA AATAAAAAAG GAATATAGCA 354 0 

AAGTGCTACA CTCCTCTATT ATAACTTATT TAACTGTTAA CATATACTAA TTATACAGAA 3600 

25 TTCCTACTAG CAAATAATAT CTTTTAATTT TAAAATTAAA CTTACAAGTT CTTCATAGGT 3660 

ATGTACATAC ATTTCTTTTG TTCCACCGTA TGGATCTATA ACTTCTCCTG CTTCTTTtAC 3720 

ATATTCATGC AATGTGAAAA CATGATTTTG CAAACCAAAG TGTGCCTCTA TTAATTCTTT 3780 

30 GTGCGAATAC GACATCGTCA AAATAATATC TGCTTTCAAA TCTGCTTCAG TAAATTGTTG 3 84 0 

CGATAAGGTC GTTTCAGCTA AATGATGTTC TTCAACTAAG TCTTCAACAT AATTCGAAAC 3 900 

ACCTTGATTG TTCACAGCGA ATATACCTCT TGATTCAAAT TGATGATTTG GCATAACCTC 3960 

35 TTTTGCAATA CTTTCCGCTA ATGGGCTACG ACATGTGTTA CCTGTACAAA CGAATAAAAT 4 020 

CTTCATAGTT CACATCCTTT AATAATGTGA TTACCTGCAG CTTTTAACAT GCGATTCATA 4 080 

ATTGCTTCTG TATTATCATT CAGCTCAAAG CCGTATATAT ACGCCGCTGA AATATTTTCA 414 0 

40 

TTTTCATCAA GTGAATGTAA CACATCATAA AGATTATGAC TTGCTTGTTT AACATCATTG 4200 

TCATCCTGAC ATAATTGAAT GAATTGCGCT TCACTTGGTA TAAACGCCAC CTTATTACTC 4260 

GGCACAATAA AAGCTATAGA AGACCAATCT TTACCGTCAT TTCCAATTTT GCTCTCAATA 4320 

45 

TCTGTAATAA TTGTAAGTGG TGTATTGGGT GAGTAATGCT TATACTTCAT ACCTGGTGCA 4 3 80 

ATTGGCTGTT CAGTATCATT ATAATCAGCA TGGGCGATAC TATTCGGAAG TATTTCTGTA 444 0 

50 ATCATTG CTG CTGTTATAGA ACCAGGTCTT GCAATTTTAT AAGGAAAAGA TGTGCAATCT 4 500 

AAAACCGTAC TTTCTAATCC TTCTTCACTT TGTTCAGCTT GAACAATACC ATCGATACGG 4 560 
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GCACTTGGAG CAGCTAGAGG TTCATTTATG ATTTGTAATA ATTGTCTACC TACAGAATGG ~ 4 680 

CTTGGCATTC TAACAGCAAC TGATGATAAA CCTCCAGAAA CTTTTCGACA TAGATAGCCT 4 74 0 

AGCTTTAACG GCAATATAAA CGAAATAGGG CCCGGCCAGA ATGCCTGCAT TAACTTTTCT 4 800 

ACGCGTGGAT CCAAAGTATA TGTAAAATCT TTTAATTGAC CTTTACTGTG TATATGAACA 4 86 0 

ATAAGCGGAT TGTCAGATGG ACGGCCTTTA GCTTCATATA TTTTAGCTAC AGCTTCTTCA 4 920 

TCTGTCGCAT TTGCTGCAAG TCCATAAACT GTTTCAGTTG GTAAACCTAT TAAACCACCG 4 980 

TTTAAAACAA TGTCTTTTAT TTCATTAATT TTAGGATATT GCTGTAAATC TTCATTATAT 504 0 

TCTCTAACAT CCCAAATTTT AGTATCCAAC TTAATCACGC CTTTCTTATT TAT CAT AAT A 5100 

TAAAGCAAAA AGCTATGCAC TTAACTAATC ATAGCAAAGG CATAACTTCT AATTACCATT 5160 

TAAATGAGAC GATTCGATCG TGGCCATTTA TATCTTTAAT AATGTCGATT TTTTTGTCAG 522 0 

GAAATTTATT TAAAATTATT GATTTAAGTG CCTCACCTTG ATTGTAACCA ATTTCAAAAA 5280 

CAACTGGGCT GCCTTTTTCC ATAACGTGAG GTAAATCTTC AATGATTGAT TCATAAATAG 534 0 

CATATCCATG GTTATCTGCA AACAATGCCT GATGTGGTTC GAATCTCGTA ACCGTTGGAG 5400 

ACATCGTAAC CATATCTTTT TCATCTATAT ATGGTGGATT AGATATCAAG CCGTTCAACT 54 60 

TGATACCTTC ATTAATTAAG GGCTTTAATG CATCCCCTGT TAAAAATTGT ATTTGTGATT 5520 

GATGCTTCTC AGCATTATTA CGAGCCATAT TCATTGCTTC AAGTGAAATA TCAGTAGCAA 5580 

30 TAACATTTAA ATCCGGCTTT TCACATTTCA AAGTAATTGC AAGTACACCA CTACCCGTTC 564 0 

CGATATCTAC GATTGTTGCA TCATCTTCTA ACTGTTGTAA GAAATGCAAC ATTACTTCTT 5700 

CAGTTTCAGG TCTTGGTATC AAACAATTTG AGTTTACATC AAACGTTCTA CCATAAAATG 5760 

35 AGGCAAAGCC AACTATATAC TGTATAGGCT CTCCTAATAA CATACGTTGT AATGCTAAGT 5820 

CGAACTTCAT AATCAT CGCT TTCGGCATAT CATCATGCAT GTGGACTACA AAGTCCGTAC 5880 

GCGTCCATTG AAATACATCT AACATTAACC ATTCAGCTCG TGTTTGTTCA AACCCTTTTT 5940 

GTTGTGTTAA ATGAATTGCT TCATCTAACT 'riU'CTlTATA - ATTCACCATT - ATTAAGTTCT 6.0.0.0. 

TTGAATTTAT CTGTCTGCTC TGATAAAGTC AGTGCATCTA TAATTTCTTC TAAATGGCCT 6060 

TCCATAATTT GCCCTAATTT TTGAAGCGTT AGAC CT AT AC GATGGTCTGT TACACGGCTT 6120 

TGTGGATAAT TATAAGTTCG AATACGTTCT GAACGATCAC CAGTACCGAC TGCTGATTTA 6180 

CGTTGTGACG CATACTTTTG TTGTTCTTCT TGAACTTTCA TATCGTATAA ACGTGCTTTT 6240 

AACACTTTCA TTGCTTTTTC ACGGTTTTGA ATTTGAGACT TCTcAGAAGA TGTTG CAATG 63 00 

ACACCAGTTG GTAAATGGGT AATACGTACT GCAGAGTCAG TTGTGTTTAC GTGCTGACCA 6360 
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ACATCTTCAA 


CTTCTGGTAA 


AACTGCCACT 


GT AG CTGTTG 


AAGTATGAAT 


ACGTCCACCT 


6480 


GATTCTGTTT 


CAGGCACACG 


TTGAACGCGG 


TGCGCACCAT 


TTTCAAATTT 


CAATTTACTA 


6540 


TACGCGCCAT 


TACCAGAAAC 


TGAGAAACTA 


ATTTCTTTGT 


AACCACCATG 


GTCACTTTCA 


6600 


GACGCTTCTA 


CTATTTCAGT 


TTTGAATCCT 


TGTGATTCAG 


CATACTTTGA 


ATACATACGC 


6660 


ATTAAATCAC 


CAGCAAAAAT 


CGCAGCCTCA 


TCACCACCTG 


CTGCTGCTCT 


TATTTCTACA 


6720 


ATAACGTCTT 


TGTCATCATT 


AGGATCTTTA 


GGAATCAATA 


ATATTTTAAG 


CTCTTCTTCA 


6780 


AGATTTGGAA 


GTTCAGCTTT 


AATACCATTA 


CTCTCCTCTT 


TTAACATTTC 


TACTTCTTCT 


6840 


TTATCATCAG 


TCTCACTTAA 


CATTTCTTCA 


ATATCAGCTA 


ATTCTTCTTT 


TTTAGCTTTA 


6900 


TAGTTACGAT 


AAACATCTAC 


AGTTTTTTGT 


AAATCAGCTT 


GCTCTTTAGA 


ATATTTACGT 


6960 


AATTTATCTG 


AATCATTTAC 


AACATCTGGG 


TCACTTAACA 


GTTCATTTAA 


CTGTTCGTAT 


7020 


CTTTCTTCTA 


CAATATCTAA 


TTGATCAAAC 


ACTTATAATT 


CCTCCTTATT 


ATTATCACTA 


7080 


GGTGCTACGA 


TATGGTGCGC 


GCGACAACGT 


GGCTCATAAC 


TTTCATTGGC 


ACCTACTAAG 


7140 


ATAATCGGAT 


CATCGATTTT 


AGCTGGTTTA 


C CATTTATT A 


ATCGTTGCGT 


TCTACTAGAT 


7200 


GAAGAACCAC 


AAACAGCACA 


AACTGCTTGA 


AGTTTCGTTA 


CTTGTTCACT 


GACAGC CATC 


7260 


AATTTAGGCA 


TTGGTTCGAA 


CGGTTCGCCC 


CTAAAATCCA 


TATCTAATCC 


AGCAACAATA 


7320 


ACACGGTGTC 


CATCTG CTGA 


TAGTTTTTCT 


ACTATACTTA 


CAATTTCATC 


GTCAAAAAAT 


7380 


TGCACTTCGT 


CTATTCCTAT 


AACATCAACA 


TTAGTTAAGT 


CGTGCGTCAT 


AATTTCACTT 


7440 


GCTTTAGAAA 


TATTAATCGC 


TTCAATGGCA 


TTAC CATTAT 


GAGAGACCAC 


TTTTTCTTTA 


7500 


TGATATCGAT 


CATCAATCGC 


CGGTTTAAAT 


ACAACGACTT 


TTTGTTTAGC 


GTATATACCC 


7560 


CTTCTTAGAC 


GTCTTATTAG 


TTCTTCGGAT 


TTACCGCTAA 


ACATACTACC 


TGTAATACAT 


7620 


TCTATCCAAC 


CGGAATGGTA 


AGTTTCATAC 


ATTGAGAGTn 


CCACCTTTTT 


CAAAACATAA 


7680 


TCGCTTTATT 


ATATCATATT 


TCAAATATTC 


ATAAATGTCT 


TTnTCATAAT 


TATATCGATA 


7740 


TTGTACATGA 


ACAATTATTT 


TA 








7762 


(2) INFORMATION FOR SEQ ID NO: 125: 









(i) SEQUENCE CHARACTERISTICS: 

(A> LENGTH: 2583 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



so 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 125: 
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TAAAAAAATT ATTATCAATG ATGAACTAGA ATTGACTGAA TTCCACCAAG AACTTACTTA 120 

TATTTTAGAC AACATAnAAG GGAATAATAA TTATGGTAAG GAATTTGTTG CAACCGTTGA 180 

AGAAACATTC GACATTGAAT AaAGCGGGGT GgaAGCACTA TGAATCAATG GGATCAGTTC 24 0 

TTAACACCTT ATAAGCAAGC GGTTGATGAG TTGAAAGkGA AcTTaAAGGC ATGCGCAAAC 3 00 

AATATGAAGT TGGTGAACAA GCGTCGCCAA TAGAATTTGT TACTGGTCGT GTTAAACCAA 360 

TCGCTAGTAT TATAGATAAG GCAAACAAAC GACAAATACC ATTTGATAGG TTAAGAGAAG 420 

AAATGTACGA TATCGCTGGT TTAAGAATGA TGTG CCAATT TGTTGAAGAT ATTGATGTTG 4 80 

TCGTCAATAT TTTAAGACAA AGAmAAGATT TTAAAGTAAT TGAAGAACGA GATTATATTC 54 0 

GTAACACTAA AGAAAGTGGT TACCGCTCGT ATCATGTCAT TATTGAATAT CCAATTGAAA 600 

CATTACAAGG CCAAAAATTT ATATTGGCTG AGATTCAGAT TCGTACATTA GCAATGAATT 660 

TCTGGGCAAC GATTGAACAT ACTTTACGAT ATAAATATGA TGGTGCTTAT CCGGATGAAA 720 

TTCAACATCG TTTGGAAAGA GCGGCAGAAG CAGCGTATTT ACTTGATGAA GAGATGTCTG 780 

AAATTAAAGA TGAAATTCAG GAAGCTCAAA AATATTACAC v GCAAAAACGT TCTAAAAAAC 840 

2s ATGAAAATGA TTAACGAGGT GTTATAAATC ATGCGTTATA CAATTTTAAC TAAAGGTGAC 900 

TCCAAGTCTA ATGCCTTAAA GCATAAAATG ATGAACTATA TGAAAGrTTT TcGCATGaTT 960 

GaGGATrGTG AAAaTCCTGA AATTGTTATT yCAGTTGGTG GTGACGGTAC ATTACTACAA 1020 

30 GCATTCCATC AGTATAGCCA CATGTTATCA AAAGTGGCAT TTGTTGGAGT TCATACAGGT 1080 

CATTTAGGAT TTTATG CGGA TTGGTTACCT CATGAAGTTG AAAAATTAAT CATCGAAATT 114 0 

AATAATTCAG AGTTTCAGGT CATTGAATAT CCATTGCTTG AAATTATTAT GAGATACAAC 1200 

GACAACGGCT ATGAAACAAG GTATTTAGCA TTAAATGAAG CAACGATGAA AACTGAAAAT 1260 

GGCTCAACAC TTGTTGTGGA TGTTAACTTA AGAGGGAAAC ACTTTGAGCG ATTTAGAGGC 1320 

GATGGATTAT GTGTATCAAC ACCTTCGGGT TCAACGGCTT ATAACAAAGC GCTAGGTGGC 1380 

GCACTGATAC ~ATCCTTCACT~TGAAGCAATG ~CAAATTACAG~^ —1440- 

CGTGTGTTTA GAACGGTAGG ATCACCACTT GTATTACCAA AGCAT CAT AC ATGTTTAATA X500 

TCACCAGTTA ATCATGATAC CATTAGAATG ACGATAGATC ATGTTAGTAT CAAACATAAA. 1560 

AATGTTAATT CAATACAATA CCGTGTAGCA AATGAAAAAG TGAGGTTTGC ACGTTTTAGA 1620 

CCATTCCCAT TCTGGAAACG TGTGCACGAT TCTTTCATAT CAAGTGATGA AGAACGATGA 16 80 

SO AATTTAAGTA T CAT AT ATCA CAACAAGAAA CTGTTAAAAC TTTTTTAGCA CGACATGATT 174 0 

TTTCTAAGAA GACAGTGAGC GCCATTAAAA ATAATGGCGC TTTAATTGTT AATGATGAAC 1800 
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AAATACCGAG TGTTAATTTA ATACCTTATG CTCGTAAGCT AGAAGTATTG TATGAAGATG 1920 

CTTTTATCAT CAT AG TTACT AAACCAAACA ATCAAAATTG TACGCCTTCG AGAGAACATC 1980 

CTCATGAAAG TTTAATCGAA CAAGTACTAT ATCATTGTCA GGAACATGGT GAAAATATTA 204 0 

ACCCACATAT TG1TACG CGT CTAGATCGTA ATACAACTGG TATTGTGATA TTCGCTAAAT 2100 

ATGGACATAT CCATCATTTA TTTTCTAAAG TAAACTTGAA AAAAATATAT ACTTGCCTTG 216 0 

TATATGGTAA AACCCATACA TCTGGTATTA TTGAAGCTAA TATTAGACGG TCAAAGGATA 2220 

GGATTATAAC TAGAGAAGTT GCCTCGGATG GTAAATACGC TAAAACATCT TATGAAGTAA 2280 

TAAATCAGAA TGATAAATAC AGTTTATGCA AAGTTCATTT GCATACGGGA CGTACACATC 234 0 

AAATTCGTGT ACATTTTCAA CATATTGGGC ATCCAATTGT GGGAGATTCT TTGTATGATG 2400 

GTTTTCATGA CAAAATTCAT GGTCAAGTAC TGCAATGTAC GCAAATATAT TTTGTTCATC 24 60 

CAATCAATAA GAACAATATT TATATTACAA TTGATTATAA GCAATTACTT AAATTATnCA 2520 

ATCAACTCTA ATnCACACAG GGGGTGTAAG TATGTCAATG AnCACAGATG AAAAAGAGCG 258 0 

TGT 2583 
25 (2) INFORMATION FOR SEQ ID NO: 126: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1818 base pairs 

(B) TYPE: nucleic acid 
<C) STRAND EDNESS : double 

30 (D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 126: 

ATCAAGTGAT ACATTTAACT GGTAAAGGAT TAAnAGATGC TCAAGTTAAA AAATCnGGAT 60 

ATATACAATA TGAATTTGTT AAAGAGGATT TnACAGATTT ATTnGCAATT ACGGATACAG 120 

TAATAAGTAG AGCTGGATCA AATGCGATTT ATGAGTTCTT AACATTACGT ATACCAATGT 18 0 

TATTAGTACC ATTAGGTTTA GATCAATCCC GAGGCGACCA AATTGACAAT GCAAATCATT 24 0 

TTGCTGATAA AGGATATGCT AAAGCGATTG ATGAAGAACA ATTAACAGCA CAAATTTTAT 300 

TACAAGAACT AAATGAAATG GAACAGGAAA GAACTCGAAT TATCAATAAT ATGAAATCGT 360 

ATGAACAAAG TTATACGAAA GAAGCTTTAT TTGATAAGAT GATTAAAGAC GCATTGAATT -42 0 

AATGGGGGGT AATGCTTTAT GAGTCAATGG AAACGTATCT CTTTGCTCAT CGTTTTTACA 48 0 

SO TTGGTTTTTG GAATTATCGC GTTTTTCCAC GAATCAAGAC TTGGGAAATG GATTGATAAT 54 0 

GAAGTTTATG AGTTTGTATA TTCATCAGAG AG CTTT ATT A CGACATCTAT CATGCTTGGG 600 
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15 



CTCATGTTAA AGCGCCACAA AATTGAAGCA TTATTTTTTG CATTAACAAT GGCATTATCT 720 

GGAATTTTGA ATCCAGCATT AAAAAATATA TTCGATAGAG AAAGACCTAC ATTGCTGCGT 780 

TTAATTGATA TAACAGGATT TAGTTTT CCT AGCGGTCATG CTATGGGATC AACTGCATAT 84 0 

TTTGGAAGTG GTATCTATCT ATTAAAT CGA TTAAATCAAG GTAATTCAAA AGGTATTCTT 900 

ATAGGGTTAT GTGCAGCTAT GATTTTATTG ATTTCCATAT CACGTGTATA TCTAGGTGTA 960 

CATTATCCAA CAGATATTAT TGCCGGCATT ATTGGTGGAT TATTTTG CAT TATTTTATCA 1020 

ACGTTATTAC TTAGAAATAA ATTAATAAAT TAAATAGTAA AAAAACAAAA GCAGTAAACC 10 80 

TAAAGTGTCG TAAGGGTTTA CTGCTTTTAT AAAACGTTGT TATAACGTAT ATTGTCTTTT 114 0 

ACGGGCATAT AAnAGGGGAA TATTTGAnAA TGACCAATCC AACAAGAACG AAACGTTGTG 1200 

GGGGGGATGT TCTATGTGGT ATTGATAATC ATTTTCAACT ACTATTATAC ATTAGTGAGA 1260 

ATCATTGTCA ATTAGAAACT AAAACTTTTT TTGAATATTT TTTAAGAATA GTAAATAAAA 132 0 

CGCATGATTA CGCTATTTTA GAAAATAAAA AAATTTGTAT TTCTCATTAG AATTAGAATA 1380 

TTTAAAAGTG ATGAGGTTTA AACATTATAT TGTTTACATA CTCCTTTTGA ATTCATACAT 144 0. 

25 TATGAAATGT tACTTCCAAG TTCAAAATCG CACATTGAAA TGATGTGTGA AATGTTTAAA 1500 

CTACGGTCAT t TTGTGmAAA TAAAG r TAAT AACTATTCAT TTTACAATAG TGAAAAGTCA 1560 

GTATATGACA ACAATTAATA TTGCGGTAAG GCCTTGTGTT ACAGTATTCT ATATTTAAGT 1620 

30 ACTGCAATCA GAATTAACAG AATGCCATTA ACTGATTATT AAATATTTGA GTTAATAAAT 1680 

AATTAATGAT TGTAGCTTGA AAAATTTAAA ACATGGTTAT TGATTTGTGA TAAAATTTAA 1740 

ACGTAAACAA ACTAATTTAA AAAGCAACTA TTGTATAGAA AAATACAAAA TTTAAAATAT 1800 

ATTACCTTAT TAGAAAAA 1818 
(2) INFORMATION FOR SEQ ID NO: 127: 
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(i) SEQUENCE CHARACTERISTICS: 
(A) LENGTH L 12658 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 127: 

TGTTTAAACA ATAGGGGGAA TCTTATGATT GAAAAATTAG TAACCTTTTT AAATG AGGTT 60 

50 GTTTGGAGTA AGCCATTAGT TTATGGTTTG CTAATTACTG GTGTGCTATT TACATTGCGT 120 

ATg CGATTTT TTCAAGTTAG ACATTTTAAA GAAATGATTC GATTAATGTT TCAAGGAGAG 180 
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GGTACAGGTA ATATTGTCGG TGTATCTACT GCAATATTTA TAGGAGGACC TGGTGCAGTA 300 

TTTTGGATGT GGATTACTGC GTTTTTAGGT GCAAGTAGTG CTTTTATTGA ATCTACACTT 360 

GGTCAAATAT TCAAGAGAGT TGAAAATAAT GAATACCGTG GTGGACCAGC GTATTATATT 42 0 

GAATATGGTA TTGGTGGTAA ATTTGGTAAA ATTTACGGAA TTAT CT TTGC TATTGTTACG 480 

ATTATCTCAG TAGGTCTATT GCTTCCTGGT GTGCAATCTA ACGCTATAGC AAGTTCTATG 54 0 

CATAATGCGA TTCATGTTCC ACAATGGTTA ATGGGTGGTA TTGTTGTAGT TA TTTT GGGA 600 

TTAATTATTT TTGGTGGTGT ACGTATTATT GCCAATGTTG CAACAGCCGT TGTACCATTT 660 

ATGGCAATTA TTTACATACT GATGGCTGTC ATTATCATTT GTATCAATAT ACAAGAAGTG 720 

CCAGCGTTAT TTGCATTAAT TTTCAAATCA GCATTTGGAT TACAATCTGC TTTTGGTGGT 78 0 

ATCGTTGGCG CAATGATAGA GATTGGTGTT AAACGTGGAT TATATTCAAA TGAGGCTGGT 84 0 

20 CAAGGTACAG GTCCACACGC AGCAGCGGCa g C AGaAGTAT CACATCCAAG TAAACAAGGT 900 

CTAGTACAAG CATTTTCAGT TTATATTGAT ACATTATTTG TATGTACTGC AACTGCTCTG 96 0 

ATTATACTTA TTTCTGGTAC ATATAATGTG ACTGATGGTA CGGTTAATGC GAATGGCACA 1020 

25 CCGCATTTAA TTAAAGATGG CGGTATTTAT GTTgAAAATG CAACAGGTAA AGATTATTCA 1080 

GGTACTGCGA TGTATGCACA AGCCGGCATt GATAAAGCGT TCCATGGCAG TGGTTATCAA 114 0 

TTTGATCCTA CTTTCTCTGG CGTAGgTTCG TACTTTATTG cATTTGCTTT ATTCTTCTTT 12 00 

GCATTTACTA CAATTTTGTC GTACTACTAC ATTACAGAAA CAAATGTTGC TTATTTAACG 12 60 

CGTAATCAAA ATAATCAAGT TTCATCGATA TTTATTAATA TTGCTCGTGT GATTATTTTG 1320 

TTCGCTACAT TTTACGGTGC AGTTAAAACA GCTGATGTAG CATGGGCATT CGGTGATTTA 13 80 

GGTGTAGGTC TAATGGCTTG GTTAAATATC ATTGCGATTT GGATTTTACA TAAGCCTGCC 1440 

GTAAATGCTT TAAAAGATTA TGAAATTCAA AAGAAACGTT TAGGCAACGG TTATAATGCA 1500 

GTTTATCAAC CTGATCCGAA TAAATTACCT AATGCTGTCT TTTGGTTGAA GACGTATCCA 1560 

GAACGTTTAA AACAAGCACG TGCCAAAAAG TAATCTACTT TTGTTTATAG TATATGTAGT 1620 

GATCATTTGA TAAAAAAGAA AAGTATTGAG AATTTTAGGt GCTCAGAAAT TTGAATTTTA 1680 

4S AAAATATAGT GTCTCTTGGT ACAATAACAA TACAACTACT AGGGGCACTT TTTTATGTCA 174 0 

GAATTTAAAA CTGGTAAGAT TAATAAACAT GTTTTATATA GTAATATTTT AAATAGAGAT 1800 

GTCACGTTAA GTATTTATTT ACCAGAATCT TATAATCAAC TTGTTAAATA TAATGTCATT 1860 

so CTTTGCTTTG ACGGATTAGA TTTTTTACGT TTCGGGAGAA TACAACGTAC ATATGAATCG 1920 

TTAATCAAAG AAGCGCGTAT TGATGATGCG ATCATTGTTG GATTCCATTA TGAAGACGTT 1980 
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GTCGGTAAAG AAATATTGCC ATTTATTGAC TCGACGTTTT CTACACTGAA AGTAGGTAAT 2100 

GCAAGGTTAT TAGTAGGGGA TAGTTTAGCG GGTAGTATTG CCTTATTAAC GGCGTTGACC 2160 

TATCCAACGA TTTTTAGTCG TGTAGCAATG TTAAGTCCAC ATTCAGATGA AAAAGTATTA 2220 

GATAAGCTAA ATCAATGTGC AAATAAAGAA CAATTGACAA TTTGGCATGT CATTGGTCTA 228 0 

GATGAAAAAG ATTTTACTTT ACCAACAAAT GGTAAGCGTG CCGATTTCTT AACACCGAAT 2340 

AGAGAATTAG CTGAACAAAT TAAGAAATAT AATATAACTT ATTATTACGA TGAATTTGAT 24 00 

GGTGGTCACC AATGGAAAGA TTGGAAACCA TTGCTGTCAG ATATATTATT GTATTTTTTA 24 60 

AGTAAAAACA CAGATGATCA ACTTTATGAA TAATTTACAT TAGTAGATTT AGTATGAATT 2520 

GTCTTCATAT AGTCTGGTCT ATAATATAAT TTATAAAAGA TTTTACTGTT TAATTTAATT 2580 

TAAATTTGAC GAAATTGCAA AAGATGTATA ATGAATTATT TTTAATGTAA CGGTTTTCAA 264 0 

AGAAATTTGA TATAATAGCA AT AGG TT AAA CAAAGGAGGA ATTCAGATGA TTTTAGGATT 2700 

AGCATTAATT CCATCAAAGT CATTTCAAGA AGCGGTGGAT TCTTACCGTA AAAGATATGA 2760 

TAAACAGTAT TCACGAATTA AACCACATGT GACAATTAAA GCGCCATTTG AAATTAAAGA 2820 

2S TGGTGATTTA GATTCTGTCA TTGAACAGGT TAGAGCTCGT ATTAATGGTA TACCAGCAGT 2 8 80 

AGAAGTTCAT GCTACAAAAG CTTCTAGCTT CAAACCAACG AACAATGTGA TTTACTTTAA 2 94 0 

AGTTGCGAAG ACGGACGACT TAGAAGAATT GTTTAATCGC TTTAATGGAG AAGATTTCTA 3000 

30 TGGAGAAGCT GAACATGTTT TTGTGCCACA CTTTACAATA GCACAAGGAC TATCTAGCCA 3060 

AGAATTCGAA GATATTTTTG GTCaAGTAGC ATTAGCTGGG GTAGACCaTA AAGAAATTAT 3120 

CGATGAATTA ACTTTGTTAC GTTTTGACGA TGACGAAGAT AAATGGAAAG TTATTGAAAC 3180 

35 GTTTAAATTA GCTTAAGTAA CATAATAGTA TTGTTAATCG TAGTATGTTT GAATTAATAA 3240 

GAAAATGGTC ATTTTTATTG AATGTAATAA AAATGAC CAT TTTCTTTATT TTAAAATACG 3 300 

TTTTAACCTT ACTTAGCTTT TTCTCTATTT ACTATAAAGT rGCTTCCATA AAATACAGCT 3360 

-AAGACTAAAA-AGATTAATGC CGAGAAATAA AATGTATTGT- TTAAATTGTT GGTAAATTGT 3420- 

GTAATTAATC CGCCAAATAA TGGCCCTATC ATTGAGCCGA ATCCTTGGAT ACTATTAAAA 34 80 

ACACCCCAAG TTTCTTCTTG TTCATCTGAT TTGATAAATC GTGCCATAAA GGTATTCCAT 354 0 

GCTGGTAATA AGATGCCATA CATTAGACCG ATAGCTAAAG CGATAATCCA CAAGATGTGA 36 00 

ATATTAACAA TCATAGATAG AGTAAAAATT AATATCATGT ATAAAATAAA TCCGCTTAGA 3660 

ATAACACCAT ACATAAAGTT TCTGCTGCGG TTATCTATTA GTTTCGATAA AAATAG CATC 372 0 

GAAACTGCAC AGCCGATACC ACCAATAATG ATTGCAACAG TATATTCAAT TGTGCTTACG 3780 
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TGTAAAAGAA TACCAGGGAA CaACAATAAA TGGcGCTTTG TCACATCAAC AATTTGTCTC 
AATTGAGCTT TAACTGGACG AGTATTATAA TTTGTTAACT TTACATCGAC AAAATAATAT 
AATATCCATG CAATTAAAAC GACTAAAGAC ATCATGAAGG CAAAGCGTGT TGGGTGCACT 
TTGATAAGTA GATTCATAAA AACCATACCT ACCAATAGGC CTAACAACCA TGAAAAATAA 
ACATAGCCCA TTTGTTTG C C ACGTTTATCT TCTTCAACAC TGGATAACAT AATGACCCAA 
ATAGGACTAA CTGCAATACC GAGCATCATA GCACTAAATA TGATTACAAA AGGTGATGCT 
GGAAACCAAA TAACTAAAAA TAAACTTGTA AATGCTAAAA TAAATCCAGT CGTTAAAACG 
ATTTTTGTGC CGAATTTTTT CAGTAAAAAT CCTATAACAA AGTTTGTAGA TGCATCAGCA 
ATAAAATGTA TTGAAAATGC TAGAGACGTT ATTG CTACAG CAATGGATGT AACTGTTGGC 
AAGAAATTAA TATAGCTTAG GATATACATG CCTCTCGCAA ATTC CATTAA AAATAAGATA 
ATAAGCaTTA AAATGAAATT TTTATGATTA GCGTAATTAT TTAACGAAGA ATCTTGCATA 
TAAAGGAACC TTTCCATAAA TCTCTTGTGG TTGTGATGAA TGACCGATTA AATCAAGTAA 
GTCTCGACAT ATTGTCTGTG TAG CATACTT AATTTTATCT TGTTCCATTG TACTAATCAT 
GTTAGTTAAT TGCTCATTAC CGTTAGTTAA ACTTGCTACA ATTTTTATTG CTTCTTCTGG 
AGTATCAGCG ATTTTACCAA AACCTTTTTC TTCAAAGTAA AGGGCATTTT CAAGCTCTTG 
ACCAGGTGCA GGATTTAGGA AAATCATTGG AATACAACGG GCGAAACCTT CAGTTATTGT 
GATACCACCA GGTTTCGTAA TCATAAGTTG ACTTGATGCC ATCCATTCAT TCATGTGTTT 
GGTATAACCT AGAATCAATA CATTCTCGTT AGATTTAAAC TTAGCTGTTA AAGAACGCTT 
TAGCTCTTTG CTCTTACCAC AAATCATAAC TACTTGTGCA TTTGCaCTTT tCGCTAATAT 
ATCAGTAATC ATCGTGTCAA AACCTTTAGA TACACCAAAT GCACCAGCTG aCATTAAAAT 
AGTTTGCTTA TCTGGATCTA AGTTGTTGTC TATTAACCAC TGCTTTTGAT TAATAGGCGT 
TTCAAATTTG TTATCAATAG GAATACCTGT CaCTTTAACT GTTGAAGGAT CAATACCTAC 
GTCTATGAAG TCTTGTTTCG TTT CT TTT G T TGCCACATAA TATCTTGTTG AATACGGCGT 
AATCCAGTTT TTATGTAAGC GATAGTCTGT CATCACTGTA GCAACTGGAA TATTAATGTT 
AAATTGCTCA GTTAGTACCG ACATAACTGG TGTAGGAAAC GTTAATAATA TTAAATCTGG 

cTriivrm ' atcaataaat taattaactt attaagtcca tagtatttgt aaaaacattt 

GTCTAGTTTA TCTGGGCGGC TGTAATAAAA CCCTTTGTAC AT ATTT CT AA AATATTTAAA 
GCTATTGATA TACCATTTTT TACAAATAGA AGTCAAAATT GGATGAGCTT CCATAAATAA 
ATCGTGCTCA ATGACGCTTA AATGGTCTAG ATTCATATCA TTAAGTTGAT TAACGATACT 
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TTGAGTAACC ATTAATAGCC ACCCTCCGTT AGTTTGAAAA TTTTATTTAA GTGTAACTTA 5700 

TTTTACGGCA TTATAAAAGA AATAAAGACG CAAAGTCGTT AGATTTATAG CAATTTTAAT 5760 

CTATAGATGA ATTGATACAA AATAAAACGT TATTTTATAA AGCAATTTAT TGTTCTATGT 5820 

TTTATTTGTA TATTTAAAAT TATCCAGTAT ACAATTATAG CATATTTTTG GAAACAATTA 5880 

TGATATTATA CCATGTTACA AGATGGTTTT AATAATTTAA GATGAGCCAT AATTGTAAAA 594 0 

CT AATT CAT A ATACCGTATG TTTTATTTTT AATAGTAGAA ATTAGAAAAT GCTGATTAGT 6000 

AGGATATAAC AGTGAAATTA TAAATTTATT AACATCAACA AAACGTGTAT AATAAACATA 6 060 

TTGTAGAAAA AGGAGCGGTT CAGTTTGGAT GCAAGTACGT TGTTTAAGAA AGTAAAAGTA 6120 

AAGCGTGTAT TGGGTTCTTT AGAACAACAA ATAGATGATA TCACTACTGA TTCACGTACA 6180 

GCGAGAGAAG GTAGCATTTT TGTCGCTTCA GTTGGATATA CTGTAGACAG TCATAAGTTC 6240 

TGTCAAAATG TAGCTGATCA AGGGTGTAAG TTGGTAGTGG TCAATAAAGA ACAATCATTA 63 00 

CCAGCTAACG TAACACAAGT GGTTGTGCCG GACACATTAA GAGTAGCTAG TATT CTAGCA 63 60 

CACACATTAT ATGATTATCC GAGTCATCAG TTAGTGACAT TTGGTGTAaC GGGTACAAAT 6420 

25 GGTAAAACTT CTATTGCGAC GATGATTCAT TTAATTCAAA GAAAGTTACA AAAAAATAGT 64 80 

G CAT ATTT AG GAACTAATGG TTTCCAAATT AATGAAACAA AGACAAAAGG TGCAAATACG 654 0 

ACACCAGAAA CAGTTTCTTT AACTAAGAAA ATTAAAGAAG CAGTTGATGC AGGCGCTGAA 66 00 

30 TCTATGACAT TAGAAGTATC AAGCCATGGC TTAGTATTAG GACGACTGCG AGGCGTTGAA 66 6 0 

TTTGACGTTG CAATATTTTC AAATTTAACA CAAGACCATT TAGATTTTCA TGG CACAATG 6720 

GAAGCATACG GACACGCGAA GTCTTTATTG TTTAGTCAAT TAGGTGAAGA TTTGTCGAAA 6780 

GAAAAGTATG TCGTGTTAAA CAATGACGAT TCATTTTCTG AGTATTTAAG AACAGTGACG 684 0 

CCTTATGAAG TATTTAGTTA TGGAATTGAT GAGGAAGCCC AATTTATGGC TAAAAATATT 6 900 

CAAGAATCTT TACAAGGTGT CAGCTTTGAT TTTGTAACGC CTTTTGGAAC TTACCCAGTA 6960 
AAATCG CCTT - ATGTTGGTAA - GTTT AATATT TCTAATATTA TGGCGGCAAT GATTGCGGTG — - — 7020- 

TGGAGTAAAG GTACATCTTT AGAAACGATT ATTAAAGCTG TTGAAAATTT AGAACCTGTT 7080 

GAAGGGCGAT TAGAAGTTTT AGATCCTTCG TTACCTATTG ATTTAATTAT CGATTATGCA 7140 

CATACAGCTG ATGGTATGAA CAAATTAATC GATGCAGTAC AGCCTTTTGT AAAGCAAAAG 7200 

TTGATATTTT TAGTTGGTAT GGCAGGCGAA CGTGATTTAA CTAAAACGCC TGAAATGGGG 7260 

CGAGTTGCCT GTCGTGCAGA TTATGTCATT TTCACACCGG ATAATCCGGC AAATGATGAC 73 20 

CCGAAAATGT TAACGGCAGA ATTAGCCAAA GGTGCAACAC ATCAAAACTA TATTGAATTT 73 80 
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GTTTTAGCAT 


CAAAAGGAAG 


AGAACCATAT 


CAAATCATGC 


CAGGGCATAT 


TAAGGTGCCA 


7500 




CATCGAGATG 


ATTTAATTGG 


CCTTGAAGCA 


GCTTACAAAA 


AGTTCGGTGG 


TGGCCCTGTT 


7560 


5 


GATTAATAAA 


AGATTTATTG 


ATGAAGGTAA 


AACTATTGAT 


GTTTATTTAT 


TCGAAGCATT 


7620 




AAATAACCAG 


ATAATCATTG 


CTATACCAGA 


TTGGTTTTGG 


TCATATCAGA 


TGGCAATGAC 


7680 




ATTAGATGAA 


GAAACTTGTT 


TTGAAGCAAT 


ACTCATGCAA 


TTGTTTGTTT 


TTAAAGAAGA 


7740 


10 


GGAAGAGGCA 


GAATCGATTG 


CATCACAACT 


AACAGATTGG 


ATAGAAACAT 


ATAAAAAGGA 


7800 




GAAAGACTAA 


TGAACTTAAA 


GCAAGAAGTT 


GAGTCTAGAA 


AGACTTTTGC 


GATTATTTCA 


7860 


15 


CATCCCGATG 


CAGGGAAAAC 


AACGTTAACT 


GAAAAACTAT 


TGTACTTCAG 


TGGTGCTATT 


7920 


CGTGAAGCGG 


GTACAGTTAA 


AGGGAAGAAG 


ACTGGTAAAT 


TTGCGACAAG 


TGACTGGATG 


7980 




AAAGTTGAAC 


AAGAGCGTGG 


TATTTCTGTA 


ACTAGTTCAG 


TAATGCAATT 


TGATTACGAT 


8040 


20 


GATTATAAAA 


TCAATATCTT 


AGATACACCA 


GGACATGAAG 


ACTTTTCAGA 


AGATACGTAT 


8100 




AGAACATTAA 


TGGCAGTTGA 


CAGTGCTGTC 


ATGGTCATAG 


ACTGTGCAAA 


AGGTATTGAA 


8160 




CCACAAACAT 


TGAAGTTATT 


TAAAGTTTGT 


AAAATGCGTG 


GTATTCCAAT 


CTTTACATTC 


8220 


25 


ATTAATAAAT 


TAGACCGAGT 


AGGTAAAGAA 


CCATTTGAAT 


TATTAGATGA 


AATCGAAGAG 


8280 




ACATTAAATA 


TTGAAACATA 


CCCTATGAAT 


TGGCCAATTG 


GTATGGGACA 


AAGTTTCTTT 


8340 




GGCATCATTG 


ATAGAAAGTC 


TAAAACAATT 


GAACCATTTA 


GAGATGAAGA 


AAATATATTA 


8400 


30 


CATTTGAATG 


ATGATTTTGA 


GTTGGAAGAA 


GATCATGCAA 


TTACAAATGA 


TAGTGATTTT 


8460 




GAACAAGCGA 


TTGAAGAATT 


AATGTTGGTT 


GAAGAAGCGG 


GTGAAGCCTT 


TGATAATGAC 


8520 




GCGCTGTTGA 


GTGGAGACTT 


AACACCTGTA 


TTTTTCGGTT 


CAGCTTTAGC 


TAACTTTGGT 


8580 


35 


GTACAAAATT 


TCTTAAATGC 


ATATGTTGAT 


TTTGCGCCAA 


TGCCAAATGC 


GAGACAAACA 


8640 




AAAGXAGACG TTGAAGTAAG 


CCCGTTTGAT 


GATTCATTTT 


CAGGATTTAT 


CTTTAAAATT 


8700 


40 


CAAGCCAACA 


TGGACCCTAA 


ACACCGTGAT 


AGAATTGCCT 


TTATGCGTGT 


CGTTAGTGGT 


8760 


GCATTTGAAC 


GTGGTATGGA 


TGTTACTTTG 


CAACGTACTA 


ATAAAAAGCA 


AAAGATCACA 


8820 




CGTTCAACGT 


CATTTATGGC 


AGACGATAAA 


GAAACTGTGA 


ATCATGCTGT 


AGCAGGCGAT 


8880 


45 


ATCATTGGAC 


TATATGATAC 


TGGTAATTAT 


CAAATTGGAG 


ATACTTTAGT 


TGGTGGAAAA 


6940 


CAAACCTACA 


GTTTCCAAGA 


TTTACCACAA 


TTTACGCCAG 


AAATTTTTAT 


GAAAGTTTCT 


9000 




GCTAAAAACG 


TCATGAAACA 


GAAGCATTTC 


CATAAAGGTA 


TTGAACAATT 


AGTACAAGAA 


9060 


50 


GGTGCGATTC 


AATACTATAA 


AACATTACAC 


ACAAACCAAA 


TTATTTTAGG 


TGCTGTTGGT 


9120 




CAGTTACAAT 


TTGAAGTTTT 


CGAACATAGA 


ATGAAAAACG 


AATATAATGT 


TGATGTTGTT 


9180 
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AAGATGAACA CATCAAGATC GATTTTAGTG 
TTTGAAAATG AATTTGCAAC AAGATGGTTT 
5 AGTTTACTTT AACAGCTCAA TTGTATAATC 

TTGAAGAAAA ATAAATTGTA TATTTTAAAA 
ATAACCTATG GCATTTTGTC AGAGGGGAGT 

10 

CGACACTTTA TCGTCATTAC GArGATATCT 
GTGAG AC CTT TGCTATTTAT TT AG CAT AGG 
AAAGGAGTTG TACATGTTAA TGGATCCAAG 
CGTTTTAGTA TTTTTAGAAG GCTTATTAGC 
GGTTAAGCAC TTACCACCCG AACAACGTAA 

20 ATTTGTATTT AGATTTTTAG CATTATTCTT 

TCAAGCTGCA GGAGCGGTTT ACTTAATTTA 
TAAACACCCA GAAATTGAAA GTCCTGAAGC 

25 TGAAGAGATT AAAGCAAGTA ACAAATCATT 

AGATATCGCA TTTGCCATTG ATT CTATGCT 
TAAAGTTGGT ATTCACTTTG GTGGTATGGA 

30 

TGGAATGATT GGTGTTATTC TAATGCGTTA 
CAAATATCCA GGACTTGAAG GTGCAGCCTt 

3S AGTTGTCATG GTATTAGCGC ACCCAGACAT 

CGTATTATGG CAATCTATTT TCTGGACAGT 
AGGTTCAGTT GTTAAAAATA AAAAATCGCA 
JO ATTTAGTTTA AGGTTGTCCT TTTTCATTTA 
AGAATGTGAA TCAAAAGATG CGATATAGTA 
TTTTTCAATA GAAATTATAT AGATTTTAAA 

45 AAGTGATTTT ATTGAATGGA GTGGACATTA 
AAAAGTCAGT nACCsaCGTA AGCGTCGTGA 
TTTAAATCAA CATCAAGATA AACAAAATAT 

SO 

GCAAATACAT AAAGATTCAA TTG AT AAG CA 
TTTAGAACAG AGAAACCGTG ATGTTAATGA 

ss 



AAAGATAGAT ATGACGATTT AGTATTCTTA 93 00 

GAAGAGAAAT TCCCTGAAAT TAAATTGTAT 93 6 0 

GAATTTGTTA CATTAAAAAT AATTGTTTCG 9420 

GAAAAAGGTA TACTATGATG TATCAAATGA 94 80 

AACTTAAGAA TCATGACCGT ATAAATGaTT 954 0 

TCCGGTAAAG TGGGCAATTT AAATTG CTT A 9600 

TCTTTTTGTT TGTACTTAAC TTATTTATTT 9660 

TTTGATCTTA CCTTATTTAT GGGTACTTGT 9720 

AG CAGATAAC GCGATTGTTA TGGCTGTAAT 9780 

AAAAGCTTTG TTTTACGGTT TGTTAGGTGC 9840 

AATTAGTATT ATCGCGAACT TTTGGTTTAT 9900 

TATGTCAATC AAAAATCTGT GGCAGTTCTT 9960 

TGGAGATGAT CATCATTATG ATGAATCTGG 10020 

CTGGGGAACT GTGTTGAAAA TAGAATTTGC 10080 

TGCTGCTTTA gCTATTGCTG TAACACTTCC 1014 0 

CTTAGGTCAG TTCGTAGTCA TGTTCCTAGG 10200 

TGCAGCAACA TGGTTTGTAG AGCTATTAAA 102 60 

CGCGATCGTT GGTTGGGTAG GTGTTAAATT 10320 

CGCTGTATTG CCTGAGCACT TCCCACATGG 10380 

ACTAATTGGA TTAGTAATTA TCGGTTGGTT 10440 

TAAATAATTG ATGTGAAGCG GACAATCTTA 10500 

ATTGACTGAT ^ T^TGAAAAA TG^TTTTGA 1 0 56 0 

TTAAGAAAAT GTGCCTTTTA TATTTAGCAT 10620 

GCAAATTAGG TGTTAATGTG TCATAATGAT 10680 

GTGGATATTG GTAAAAAACA TGTAATTCCT 1074 0 

ATTCTTCCAC AACGAAGACA GAGAAGAAAA 10800 

AGATAATACA ACATCAAAAA AAGCAGATAA 10860 

CGAACGTTTT AAAAATAGTT TATCATCGCA 10920 

GAATAAAGCT GAAGAAAGTA AAAGTAATCA 10980 
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AAATTCATTA GATTCAGTGG ACCAAGATAC AGAGAAATCA AAATATTATG AGCAAAATTC 11100 

TGAAGCGACT TTATCAACTA AATCAACCGA TAAAGTAGAA TCAACTGAAA TGAGAAAGCT 11160 

AAGTTCAGAT AAAAACAAAG TTGGTCATGA AGAGCAACAT GTACTTTCTA AACCTTCAGA 11220 

ACATGATAAA GAGACTAGAA TTGATTCTGA GTCTTCAAGA ACTGATTCAG ACAGCTCGAT 112 80 

GCAGACAGAG AAAATAAAAA AAGACAGTTC AGATGGAAAT AAAAGTAGTA ATCTGAAATC 1134 0 

TGAAGTAATA TCAGACAAAT CAAATACAGT ACCAAAATTG TCGGAATCTG ATGATGAAGT 114 00 

AAATAATCAG AAGCCATTAA CTTTACCGGA AGAACAGAAA TTGAAAAGAC AGCAAAGTCA 114 60 

75 AAATGAGCAA ACAAAAACCT ATACATATGG TGATAGCGAA CAAAATGACA AGTCTAATCA 11520 

TGAAAATGAT TTAAGTCATC ATATACCATC GATAAGTGAT GATAAAGATA ACGTCATGAG 11580 

AGAAAATCAT ATTGTTGACG ATAATCCTGA TAATGATATC AATACACCAT CATTATCAAA 11640 

20 AACAGATGAC GATCGAAAAC TTGATGAAAA AATTCATGTT GAAGATAAAC ATAAACAAAA 11700 

TGCAGACTCG TCTGAAACGG TGGGATATCA AAGTCAGTCA ACTGCATCTC ATCGTAGGAC 11760 

TGAAAAAAGA AATATTTCTA TTAATGACCA TGATAAATTA AACGGTCAAA AAACAAATAC 11820 

AAAGACATCG GCAAATAATA ATCAAAAAAA GGCTACATCA AAATTGAACA AAGGGCGCGC 11880 

TACGAATAAT AATTATAGTG ACATTTTGAA AAAGTTTTGG ATGATGTATT GGCCTAAATT 11940 

AGTTATTCTA ATGGGTATTA TTATTCTAAT TGTTATTTTG AATGCCATTT TTAATAATGT 12000 

GAACAAAAAT GATCGCATGA ATGATAATAA TGATGCAGAT GCTCaAAAAT ATACGACAAC 12060 

GATGAAAAAT GCCAATAACA CAGTTAAATC GGTCGTTACA GTTGAAAATG AAACATCAAA 12120 

35 AGATTCmTCA TTACCTAAAG ATAAAGCATC TCaAGACGAA GTGGGATCAG GTGTTGTATA 12180 

TAAAAAATCT GGAGATACGT TATATATTGT TACGAATGCA CACGTTGTCG GTGATAAAGA 12240 

AAATCaAAAA ATAACTTTCT CGAATAATAA AAGTGTTGTT GGGAAAGTGC TTGGTAAAGA 12300 

TAAATGGTCA GATTTAGCTG TTGTTAAAGC AACTTCTTCA GACAGTTCAG TGAAAGAGAT 12360 

AGCTATTGGA GATTCAAATA ATTTAGTGTT AGGAGAGCCA ATATTAGTCG TAGGTAATCC 12420 

ACTTGGTGTA GACTTTAAAG GCACTGTGAC AGAAGGTATT ATTTCAGGTC TGAACAGAAA 12480 

TGTTCCTATT GATTTCGATA AAGATAATAA ATATGATATG TTGATGAAAG CTTTCCAAAT 12540 

TGATGCATCA GTAAATCCAG GTAACTCGGG TGGTGCTGTC GTCAATAGAG AAGGAAAATT 12600 

AATAGGTGTA GTTGCAGCTA AAATTAGTAT GCCAAACGTT GAAAnTATGT CATTTGCA 12658 

<2) INFORMATION FOR SEQ ID NO: 128: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6048 base pairs 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



5 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 12 8: 





TGAAATnGAA 


TAGTACTATT 


GCAAGTGTAA 


AGAGGTTAAT 


TTTTGCCnCA 


CGCGGGACTT 


60 


10 


AAAAAGGCAA 


CCACTGGTTG 


TGACATATCC 


TTATTTACAT 


TTATAAATAT 


AAGGAGGAGG 


120 




TAGTAGTGAA 


AGACTTATTG 


CAAGCACAGC 


AAAAGCTTAT 


ACCGGATCTC 


ATAGATAAAA 


180 




TGTATAAACG 


T TTTTCT ATT 


CTTACTACTA 


TCTCAAAAAA 


TCAG CCTGTC 


GGACGTCGAA 


240 


15 


GTTTAAGCGA 


ACATATGGAT 


ATGACTGAAC 


GTGTACTGCG 


TTCTGAAACA 


GATATGCTTA 


300 




AGAAACAAGA 


TTTGATAAAA 


GTTAAGCCTA 


CCGGAATGGA 


AATTACAGCT 


GAAGGTGAGC 


360 




AACTGATTTC 


GCAATTGAAA 


GGTTACTTTG 


ATATCTATGC 


AGATGATAAT 


CGTCTGTCAG 


420 


20 


AAGGTATTAA 


n k t» « » merxr* 

oAni/w\i j. j. 




AAGTTCATGT 




uniuu ivjnin 


A Q f\ 
"SOU 




ATAGTCAATC 


TGTTAAAACA 


GAATTAGGTA 


GACAAGCAGG 


TCAATTACTT 


GAAGGCATAT 


540 


25 


TACAAGAAGA 


CGCGATAGTT 


GCTGTAACTG 


GCGGATCCAC 


GATGGCATGT 


GTTAGTGAAG 


600 


CAATTCATTT 


ATTACCATAT 


AATGTATTCT 


TCGTACCAGC 


CAGAGGTGGA 


CTAGGCGAAA 


660 




ATGTTGTCTT 


TCAGGCAAAC 


ACAATTGCAG 


CCAGTATGGC 


aCAACAAGCT 


GGCGGTTATT 


720 


30 


ATACGACGAT 


GTATGTACCT 


GATAATGTCA 


GTGAAaCAAC 


ATATAATACA 


TTGTTGTTAG 


780 




AGCCATCAGT 


CATAAACACT 


TTAGACAAAA 


TTAAACAAGC 


AAACGTTATA 


TTACACGGCA 


840 




TTGGTGATGC 


GCTGAAGATG 


GCGCATCGAC 


GTCAATCACC 


TGAAAAGGTC 


ATTGAACAAC 


900 


35 


TTCAACATCA 


TCAAGCTGTC 


GGAGAGGCAT 


TTGGTTATTA 


TTTTGATACA 


CAAGGTCAAA 


960 




TTGTCCATAA 


GGTTAAAACA 


ATTGGACTTC 


AATTAGAAGA 


CCTTGAATCA 


AAAGACTTTA 


1020 




TTTTTGCAGT 


TGCAGGAGGC 


AAATCGAAAG 


GTGAAGCAAT 


TAAAGCATAC 


TTGACGATTG 


1080 


40 


CACCCAAGAA 


TACAGTGTTA 


ATCACTGATG 


AAGCCGCAGC 


AAAGATAATA 


CTTGAATAAGL _ 


1140 




AGATAAAAAG 


TTTAATACTT 


TTTAAATATC 


ATTTTAAAGG 


AGGCCATTAT 


AATGGCAGTA 


1200 


45 


AAAGTAGCAA 


TTAATGGTTT 


TGGTAGAATT 


GGTCGTTTAG 


CATTCAGAAG 


AATTCAAGAA 


1260 


GTAGAAGGTC 


TTGAAGTTGT 


AGCAGTAAAC 


GACTTAACAG 


ATGACGACAT 


GTTAGCGCAT 


1320 




TTATTAAAAT 


ATGACACTAT 


GCAAGGTCGT 


TTCACAGGTG 


AAGTAGAGGT 


AGTTGATGGT 


1380 


50 


GGTTTCCGCG 


TAAATGGTAA 


AGAAGTTAAA 


TCATTCAGTG 


AACCAGATGC 


AAGCAAATTA 


1440 




CCTTGGAAAG 


ACTTAAATAT 


CGATGTAGTA 


TTAGAATGTA 


CTGGTTTCTA 


CACTGATAAA 


1500 




, GATAAAGCAC 


AAGCTCATAT 


TGAAGCAGGC 


GCTAAAAAAG 


TATTAATCTC 


AGCACCAGCT 


1560 
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ACAGTTGTTT CAGGTGCTTC ATGTACTACA AACTCATTAG CACCAGTTGC TAAAGTTTTA 1680 

AACGATGACT TTGGTTTAGT TGAAGGTTTA ATGACTACAA TTCACGCTTA CACAGGTGAT 174 0 

CAAAATACAC AAGACGCACC TCACAGAAAA GGTGACAAAC GTCGTGCTCG TGCAGCGGCA 1800 

GAAAACATCA TCCCTAACTC AACAGGTG CT GCTAAAGCTA TCGGTAAAGT TATTCCTGAA 1860 

ATCGATGGTA AATTAGATGG TGGTGCACAA CGTGTTCCTG TAGCTACAGG TTCATTAACT 192 0 

GAATTAACAG TAGTATTAGA AAAACAAGAC GTAACAGTTG AACAAGTTAA CGAAGCTATG 1980 

AAAAATGCTT CAAACGAATC ATTCGGTtAC ACTGAAGACG AAATCGTTTC TTCAGACGTT 204 0 

,5 GTAGGTATGA CTTACGGTTC ATT ATT CG AC GCTACACAAA CTCGTGTAAT GTCAGTTGGC 2100 

GACCGTCAAT TAGTTAAAGT TGCAGCTTGG TATGATAACG AAATGTCATA TACTGCACAA 2160 

TTAGTTCGTA CATT AG CAT A CTTAGCTGAA CTTTCTAAAT AATTTTAGTA TAGTTTTTAT 222 0 

20 TCAAATACGC TAGTGCTCAG AACTATTTAG CATTAATTAA AGCTTATGAG TAAGCGGGGA 22 8 0 

GCACAAACGC TTCTCCGCTT ATTTTTATAT AAAATTTCCT AATTACAAGG AGGAAACACC 234 0 

ATGGCTAAAA AAATTGTTTC TGATTTAGAT CTTAAAGGTA AAACAGTCCT AGTACGTGCT 24 00 

GATTTTAACG TACCTTTAAA AGACGGTGAA ATTACTAATG ACAACCGTAT CGTTCAAGCT 24 6 0 

TTACCTACAA TTCAATACAT CATCGAACAA GGTGGTAAAA TCGTACTATT TTCACATTTA 2520 

GGTAAAGTGA AAGAAGAAAG TGATAAAGCA AAATTAACTT TACGTC CAGT TGCTGAAGAC 2580 

TTATCTAAGA AATTAGATAA AGAAGTTGTT TTCGTACCAG AAACACGCGG CGAAAAACTT 264 0 

GAAGCTGCTA TTAAAGACCT TAAAGAAGGC GACGTATTAT TAGTTGAAAA TACACGTTAT 2700 

GAAGATTTAG ACGGTAAAAA AGAATCTAAA AATGATCCAG AATTAGGTAA ATACTGGGCA 2760 

TCTTTAGGTG ATGTGTTTGT AAATGATGCT TTTGGTACTG CGCATCGTGA GCATGCATCT 2820 

AATGTTGGTA TTTCTACACA TTTAGAAACT GCAGCTGGAT TCTTAATGGA TAAAGAAATT 2880 

*0 AAGTTTATTG GCGGCGTAGT TAACGATCCA CATAAACCAG TTGTTGCTAT TTTAGGTGGA 2940 

GCAAAAGTAT CTGACAAAAT TAATGTCATC AAAAACTTAG TTAACATAGC TGATAAAATT 3000 

ATCATCGGCG GAGGTATGGC TTATACTTTC TTAAAAG CGC AAGGTAAAGA AATTGGTATT 3060 

TCATTATTAG AAGAAGATAA AATCGACTTC GCAAAAGATT TATTAGAAAA ACATGGTGAT 3120 

AAAATTGTAT TACCAGTAGA CACTAAAGTT GCTAAAGAAT TTTCTAATGA TGCCAAAATC 3180 

ACTGTAGTAC CATCTGATTC AATTCCAGCA GACCAAGAAG GTATGGATAT TGGACCAAAC 324 0 

ACTGTAAAAT TATTTGCAGA TGAATTAGAA GGTGCGCACA CTGTTGTATG GAATGGACCT 3300 

ATGGGTGTAT TCGAGTTCAG TAACTTTGCA CAAGGTACAA TTGGTGTATG TAAAGCAATT 3 360 
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TCTTTAGGTT TTGAAAATGA CTTCACTCAT ATTTCAACTG GTGGCGGCGC GTCATTAGAG 34 80 

TACCTAGAAG GTAAAGAATT GCCTGGTATC AAAGCAATCA ATAATAAATA ATAAAGTGAT 3540 

AGTTTAAAGT GATGTGGCAT GTTTGTTTAA CATTGTTACG GGAAAACAGT CACAAGATGA 3600 

CATCGTGTTT CATCACTTTT CAAAAATATT TACAAAACAA GGAGTGTCTT TAATGAGAAC 3660 

ACCAATTATA GCTGGTAACT GGAAAATGAA CAAAACAGTA CAAGAAGCAA AAGatTCGTC 3720 

AATACATTAC CAACACTACC AGATTCAAAA GAAGTAGAAT CAGTAATTTG TGCACCAGCA 37 80 

ATTCAATTAG ATGCATTAAC TACTG CAGTT AAAGAAGGAA AAGCACAAGG TTTAGAAATC 3 84 0 

GGTGCTCAAA ATACGTATTT CGAAGATAAT GGTGCGTTCA CAGGTGAAAC GTCTCCAGTT 3 900 

GCATTAGCAG ATTTAGGCGT TAAATACGTT GTTATCGGTC ATTCTGAACG TCGTGAATTA 3 960 

TTCCACGAAA CAGATGAAGA AATTAACAAA AAAGCGCACG CTATTTTCAA ACATGGAATG 4020 

20 ACTCCAATTA TATGTGTTGG TGAAACAGAC GAAGAGCGTG AAAGTGGTAA AGCTAACGAT 4 080 

GTTGTAGGTG AGCAAGTTAA GAAAGCTGTT GCAGGTTTAT CTGAAGATCA ACTTAAATCA 4140 

GTTGTAATTG CTTATGAACC AATCTGGGCA ATCGGAACTG GTAAATCATC AACATCTGAA 4 200 

GATGCAAATG AAATGTGTGC ATTTGTACGT CAAACTATTG CTGACTTATC AAGCAAAGAA 4260 

GTATCAGAAG CAACTCGTAT TCAATATGGT GGTAGTGTTA AACCTAACAA CATTAAAGAA 4320 

TACATGGCAC AAACTGATAT TGATGGGGCA TTAGTAGGTG GCGCATCACT TAAAGTTGAA 43 80 

GATTTCGTAC AATTGTTAGA AGGTGCAAAA TAATCATGGC TAAGAAACCa ACTGCGTTAA 4 440 

TTATTTTAGA TGGTTTTGCG AACCGCGAAA GCGAACATGG TAATGCGGTA AAATTAGCAA 4 500 

ACAAGCCTAA TTTTGATCGT TATTACAACA AATATCCAAC GACTCAAATC GAAGCGAGTG 4560 

GCTTAGATGT TGGACTACCT GAAGgACAAA TGGGTAACTC AGAAGTTGGT CATATGAATA 4620 

TCGGTGCAGG ACGTATCGTT TATCAAAGTT TAACTCGAAT CAATAAATCA ATTGAAGACG 4 680 

40 GTGATTTCTT TGAAAATGAT GTTTTAAATA ATGCAATTGC ACACGTGAAT TCACATGATT 474 0 

CAGCGTTACA CATCTTTGGT TTATTGTCTG ACGGTGGTGT ACACAGTCAT TACAAACATT 4 800 

TATTTGCTTT GTTAGAACTT GCTAAAAAAC AAGGTGTTGA AAAAGTTTAC GTACACGCAT 4 860 

TTTTAGATGG CCGTGACGTA GATCAAAAAT CCGCTTTGAA ATACATCGAA GAGACTGAAG 4 920 

CTAAATTCAA TGAATTAGGC ATTGGTCAAT TTGCATCTGT GTCTGGTCGT TATTATGCAA 4 980 

TGGATCGTGA CAAACGTTGG GAACGTGAAG AAAAAGCTTA CAATGCTATT CGTAATTTTG 504 0 

ATGCCCCAAC TTATGCAACT GCCAAAGAAG GTGTAGAAGC AAGCTATAAT GAGGGCTTAA 5100 

CTGACGAATT CGTAGTACCA TTCATCGTTG AGAATCAAAA TGACGGTGTT AATGATGGAG 5160 
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CG AACAGAGC ATTCGAAGGC TTTAAAGTTG AACAAGTTAA AGACTTATTC TATGCAACAT 5280 

TCACTAAGTA TAATGACAAT ATCGATGCGG CTATCGTCTT CGAAAAAGTT GATTTAAATA 5340 

ATACAATTGG TGAAATTGCA CAAAATAACA ATTTAACTCA ATTACGTATT GCAGAAACTG 54 00 

AAAAATACCC TCACGTTACT TACTTTATGA GTGGTGGACG TAACGAGGAA TTTAAAGGTG 5460 

AACGCCGTCG TTTAATTGAT TCACCTAAAG TTGCAACGTA TGACTTGAAA CCAGAAATGA 5520 

GTGCTTATGA AGTTAAAGAT G CATT ATT AG AAGAGTTAAA TAAAGGTGAC TTGGACTTAA 5580 

TTATTTTAAA CTTTGCTAAC CCTGATATGG TTGGACATAG TGGTATGCTT GAGCCGACAA 564 0 

, 5 TCAAAGCAAT CGAAGCGGTT GATGAATGTT TAGGAGAAGT GGTTGATAAG ATTTTAGACA 5700 
TGGACGGTTA TGCAATTATT ACTGCTGACC ATGGTAACTC TGATCAAGTA TTGACGGaTG * 5760 

ATGATCAACC AATGACTACG CAwACAACGA ACCCAGTACC AGTGATTGTA ACAAAAGAAG 5820 

20 GCGTTACACT TAGAGAAACT GGTCGCTTAG GTGACTTAGC ACCTACATTA TTAGATTTAT 58 80 

TAAATGTAGA ACAACCTGAA GATATGACAG GTGAaTCTTT AATTAAACAC TAATATTGTA 594 0 

AAAGATGTTA AGTAAACGCT TAATGACACT TATTTTTTGA AAATAATAGT AAT AT CnTTT 6000 

25 

TGTTAAATGA AAGAATAAAG CTATAATAAT TATAGAATAA CTATTTAn 604 8 

(2) INFORMATION FOR SEQ ID NO: 129: 

(i) SEQUENCE CHARACTERISTICS: 
50 (A) LENGTH; 56 02 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY; linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 129: 

AAAGAAGTGC AAGATATCAT CGCATTAATT AAGTCGTTAC AAAgTGTAAT TGTAGACaTC 60 

40 GCTTCCAATA ATGTTGATAC AATTATGCCT GGTTATACTC ATTTACAGCG TGCACAGCCA 120 

ATTTCATTTG CACATCATAT TATGACTTAT TTTTGGATGT TACAACGAGA CCAACAACGA 180 

TTTGAAGATA GTTTAAAACG AATCGATATT AATCCTTTAG GTGCAGCAGC CTTAAGTGGT 24 0 

ACCACATACC CTATCGATAG ACACGAGACA ACAGCATTGT TGAACTTTGG CAGTCTCTAT 3 00 

GAGAATAGCC TAGATGCTGT TAGTGACAGA GACTATATTA TTGAAACATT GCATAATATT 360 

TCTTTAACGA TGGTTCACTT ATCACGCTTT G C AG AGGAAA TTATTTTCTG GTCCACAGAC 4 20 

GAAGCTAAAT TCATTACATT ATCAGATGCA TTTTCAACTG GCTCATCTAT TATGCCACAA 4 80 

AAGAAAAATC CTGATATGGC AGAATTAATT AGAGGTAAAG TTGGTCGAAC GACTGGTCAT 54 0 
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GAAGATAAAG AAGGTTTATT CGATGCTGTC CATACAATTA AAGGTTCTTT ACGTATTTTC 660 

GAAGGTATGA TTCAAACGAT GACAATTAAT AAAGAACGAC TCAATCAAAC TGTTAAAGAA 720 

GATTTTTCAA ATGCAACGGA ACTAGCAGAT TATTTAGTAA CTAAAAATAT TCCATTTAGA 780 

ACTGCACATG AAATTGTAGG AAAAATCGTC TTAGAATGTA TACAACAAGG TCATTATTTA 84 0 

TTAGATGTTC CTTTAGCAAC ATATCAACAA CATCATTCTA GTATTGATGC CGATATTTAC 900 

GATTATTTGC AGCCTGAAAA TTGTTTAAAA CGACGTCAAA GTTACGGTTC AACAGGTCAA 960 

TCATCGGTCA AACAACAACT TGATGTTGCT AAACAATTAC TATCACAATA AATACGTTAA 1020 

>5 TCTACCTACC CACAATGTCT ATTAAAATTA CATTGTGGGT ATTTTAATGC TCTCTTCGTC 1080 

TTGTTGAACA TCACATTTTT AAGATTCCTA AAATGTTTGA TAATTCTTTT AAATTTATAT 1140 

TACAAAAATG TTATAAATTG TAAAAGAAAT GTGTAAAGCG TTTTCACAAG CAGGTTTTTG 1200 

20 TAGTATTTTA AAATTGTTAG ACTACAAATA AAGAGATGAA AGGATAAAGA CTATGACTAA 1260 

CTCTTCGAAA AGCTTCACTA AATTTATGGC TGCTTCTGCT GTTTTTACTA TGGGATTTTT 1320 

ATCAGTACCT ACTGCTGGCG CTGAACAAAC AAATCAAATT GCAAATAAAC CTCAGGCTAT 1380 

TCAATGGCAT ACAAATTTAA CGAATGAGCG ATTCACTACT ATCGCACATC GTGGCGCAAG 1440 

TGGCTATGCA CCCGAGCATA CGTTTCAAGC ATATGATAAG AGTCATAATG AGTTAAAAGC 1500 

ATCTTATATC GAAATTGATT TACAACGTAC CAAAGATGGC CATTTAGTTG CTATGCATGA 1560 

TGAAACTGTT AACCGTACAA CAAATGGACA CGGTAAAGTT GAGGATTATA CCCTTGATGA 162 0 

ATTAAAACAG TTAGATGCAG GAAGTTGGTT TAATAAAAAA TATCCAAAAT ACGCAAGAGC 16 80 

AAGTTATAAA AATGCTAAAG TACCCACTTT AGATGAAATT TTAGAACGTT ATGGCCCGAA 1740 

TGCAAACTAT TATATTGAAA CAAAGTCACC TGATGTATAC CCAGGAATGG AAGAACAATT 1800 

ATTAGCTTCA TTGAAAAAGC ATCACCTTTT AAATAACAAT AAATTAAAAA ATGGACATGT 1860 

40 AATGATTCAA TCATTTTCTG ACGAAAGTTT AAAGAAAATT CATCGTCAAA ATAAGCATGT 1920 
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GCCATTAGTA AAATTAGTTG ATAAAGGTGA ACTACAACAA TTT AACGAC C AACGCTTAAA 1980 

AGAGATACGC TCTTATGCGA TTGGATTAGG TCCTGATTAT ACAGATTTAA CTGAACAAAA 204 0 

TACCCATCAT TTAAAAGACT TAGGATTTAT AGTACATCCT TATACAGTGA ATGAAAAAGC 2100 

TGATATGTTA CGATTAAATA AATATGGCGT TGATGGTGTC TTTACAAATT TCGCTGATAA 2160 

ATATAAAGAA GTCATTAAGT AGTAATGTTA AACTAGAAAA CATAAATACA AAAATATAGC 22 20 

TATTACTATA AAAAACAGCA GTAAGATATT TCCAAATTGA AATTATCCTA CTGCTGTCTT 22 80 

TTTGGGAGTG GGACAGAAAT GAT ATTTT CG CAAAATTTAT TTCGTCGTCC CACCCCAACT 2 34 0 



55 



6NSOOC1D: <EP 078651 9A2J_> 



704 



10 



25 



EP0 786 519 A2 

TTGTCTGTAG AAATTGAGGA GCTAATTTCT CTGTGTCGGG GCTCCACCCC AACTTGCACA 2 4 60 

CTATTGTAAG CTGACTTTCC GCCAGCCTCT GTGTTGGGGC CCCGCCAACT TGCACACTAT 2 520 

TGTAAGCTGA CTTTCCACCA GCCTCTGTGT TGGGGCCCCG ACTATTTTTG AAAAGAGCGT 2580 

GTTACACGGG CATTGTTTTA CAGTCAACTA CTGCTAAAAT AAAATTAACG AGCTTAGGGC 264 0 

TTTGTTTTCT GTCCCAAGCT CGTTAAATCA CATATGATAA TTAATTATGC CCAACCACGA 2700 

TATCTAGCTG CTTCTGCTGT ACGTTTAATA CCTATGATAT ATGCTGCAAG TCTCATATCT 2 76 0 

ATTTTTCGGT TTTGAGACAA TTCGTAAATC GTATCAAATG CCGCTTCTAA TTTTTCACGT 2 820 

r5 AGCTTTTCAT TAACTTCTTC TTCAGACCAA TAATAACCTT GATTATTTTG TACCCATTCG 2880 

AAGTAAGAAA CCGTtACACC ACCAGCACTT GCTAATACGT CTGGAACTAA TAATATACCA 294 0 

CGTTCAGTTA AAATACGTGT TGCTTCTGGT GTTGTAGGTC CATTAGCAGC TTCAACAACG 3000 

20 ATACTAGCTT TAATATCATG TGCATTGTCT TCTGTAATTT GGTTTGAAAT AGCCGCTGGT 3060 

ACTAAAATGT CACAATCTAA TTCAAACAAT TCTTTATTTG AGATTGTTTC TTCAAATAAA 3120 

TTTGTTACCG TACCAAAACT ATCACGACGG TCTAATAAAT AATCTATATC TAAGCCATTT 3180 

GGATCGTGTA ATGCACCGTA AGCATCAGAG ATACCTACAA TTTTTGCACC TAAATCATAT 324 0 

AAGAATTTAG CTAAGAAACT TCCGGCATTA CCGAAACCTT GAATAACAAC CTTGGCACCT 3300 

TCAATTTGCA T ATT ACGAC G TTTTGCAGCT TGTTCAATTG CAATAACTAC ACCTAGTGCA 3360 

GTTGATCTGT CGCGTCCATG AGAACCACCC AATACAATTG GTTTACCTGT GATGAAACCT. 34 20 

GGTGAATTAA ATTTATCTAA TG CACT AT AT TCATCCATCA TCCAAGCCAT AATTTGTGAG 34 80 

35 TTTGTAAATA CATCTGGTGC TGGAATATCT TTGTTCGGAC CTACGAATTG TGAAATTGCT 354 0 

CTTACATATC CGCGTGATAA ACGTTCAACT TCATGAATGC TCATTTGACG TGGATCACAA 3600 

ACGATACCAC CCTTACCACC ACCGTATGGT AAGTTTACAA TGCCACATTT CAAAGTCATC 3660 

40 CACATTGATA ATGCTTTTAC TTCTTCTTCA TCAACATCTG GGTGGAAACG CACGCCCCCT 3720 

TTTGTTGGTC CAACAGCATC ATTATGTTGC GCACGGTAAC CTGTGAATGT TTTTACTGTG 3780 

CCATCATCCA TTCGTACAGG GATACGCACT TGTAACATTC TTAAAGGTTC TTTAATTAAA 384 0 

TCGTACATTC CTtCGTCAAA TCCCAATTTA TGCAATGCTT CTTTAATAAT TCCTTGAGTA 3 900 

GAAGTTACTA AATTATTGTT CTCAGTCATG ATCCTTTTCG CCTCTTCTTT ACCTAATGAT 3 960 

TTCGCTTTCA AACATATTGT AACATAACGT ATTCCTTTTT AAAGCCCTTA CAAACTGATT 4 0 20 

GTTACAACTT TTTGACATTA TTGAAATACA TGTCTTATTT TTTCAAGTGC AAGGTCCAAT 4 080 

TCTTCTTTAG TAATAATTAA TGGTGGTGCA AAACGAATGA CAGTATCATG CGTTTCTTTA 4140 
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ACACCTATAA ACAAACCACG TCCACGGACT TCTTTAATTG ATGGATGATC AATTTGCTTT 4260 

AATTGTTCTT TAAAATAATC TCCTAATTCT AAAGAGCGGC CTGGTAAATC CTCATCAACG 4320 

5 ATAACATCTA ATGCAGCAAT TGATGCAGCA CAAGCAAGTG GATTACCACC AAATGTTGAA 43 80 

CCATGTGAGC CAGGTGTAAA GACATCTAAT ACTTCTTTAT CTGCTAATAC AACAGAAATT 444 0 

GGGAAGACTC CACCACCTAG TGCTTTACCT AAAATATAGA CATCAGGTTT TACATTATCC 4 500 

W CAATCCGTAG CAAATAATTT ACCCGAACGA CCTAATCCTG CTTGGATTTC GTCAGCAATA 4560 

AATAAGACAT TATGTTCATC ACATAATTCT CTAATTGCTT TCAAATATCC TTCTGGCGGT 4 620 

ATATTTATAC CCGCTTCACC TTGAATTGGT TCTACTAAAA CTGCTGCAGT ATTTTCATTA 46 80 

ATTGCAGCTT TCAATGCATC TACATCTCCA AAATCAACTT TTCTAAATCC ATCTAATAAC 4 74 0 

GGACCATAAC CACGTTGGTA TTCTGCTTCT GAAGATAATG AAACTGGCGC CATTGTTCGA 4 800 

CCATGGAAGT TACCATTAAA TGCAATGATT TCTG CTTTAT TTGGCTCAAT TCCTTTAACA 4 860 

20 

TCGTATGCCC AGCGTCGTGC TGCTTTCAAA GCTGTTTCTA CTGCTTCAGC ACCTGTATTC 4 920 

ATTGGTAAAG CTTTATCTTT ACCTGCCAGT TTACAAATTT TTTCGTACCA TTCACCTAAG 4 980 

25 TTAT CACTAT GAAAAGCACG TGAAACTAAA GTCACTTTAT CAGCTTGATC TTTTAATGCT 504 0 

TGAATAATTT TCGGATGTCT ATGACCTTGG TTAACAGCGG AATATGCAGA TAACATATCC 5100 

ATATATTTAT TGCCTTCAGG ATCTTTAACC CATACCCCTT CAGCTTcTGa AATGaCAATT 5160 

30 GG c AATGGTA AATAATTATG TGCTCCGTAA TGATTTGTTA ACT CAATAAT TTTTTCAGAT 5220 

TTAGTCATCA TATCTCCCCT TTTCATCATT TATAACTATT ATACATGAAA CATTATCCAA 52 80 

ATAATTACAT TAGTTTTCAA AGCAGATACT TTTCCACCAA AAAAGATGAA ATAATCACTA 534 0 

35 

AG TTT CATT A AATTTGTCTA TTTTGAAAAC CCTTACATTT ATAATGACAT AATTACTTAA 54 00 

ATGaJTACAA GCAAAAGAAT TGATAATTTT ACACTTAATC AAAAGTATAT TTTACTAAGA 5460 

ATATTTTTAT TTATAAATAT TGAAAACCAC TAACAAATTG CATACACAAT ATCATTAGTG 5520 

40 ^ . , ^ 

GTAACAGTTA AACACTTATT TATCTTTACG GGGTAATGGG TTAAAACCCT TnCATTAAAA 5580 

TTGGATGnCC ATAAAATTAG GG 5602 
45 (2) INFORMATION FOR SEQ ID NO: 130: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5924 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
50 (D) TOPOLOGY: linear 
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TAACCCCATT TTACCTGGAA AAATCgTTTG CGATGCaATm GCaTTtGaAT ATAaATACAT 60 

TTTACGTATa GAATTATAAA AgGTTTCATT CaAATCTTAG GGTCAAAAAT GTTATAATAT 120 

TTTTATGTCA AATTTAAAAC AGTAACACTT ATTTACAAGG TTGCAATATT TTGAAGTAAT 180 

AAAGGAAGTG TCGCGTATTT TAACTTTTTC AGAGCAAAAT GCACTCGCGA AAATAGATGA 24 0 

TTTAATGAAT ACTTATTGCA ATCAATGTCC AATCAAAACT CGTCTGCGTA AATTAGAGGG 3 00 

GAAAACGAAG GCGCATCATT TTTGTATCAA TGAGTGTTCA ATAGGGAAAG AAATAAAACA 36 0 

ATTAGGAAAT GAACTTCAAT AGGAGGAAGT CAAATGAAAA TTATATCTAT ATCAGAAACA 4 20 

CCGAACCACA ACACAATGAA GATTACACTT AGTGAAAGCA GAGAAGGTAT GACATCAGAT 4 80 

ACGTATACTA AAGTTGATGA TTCACAGCCA GCATTTATTA ATGACATCTT AAAGGTTGAA 54 0 

GGCGTTAAAT CAATTTTCCA TGTTATGGAC TTTATTTCAG TAGATAAAGA AAATGACGCA 6 00 

20 AATTGGGAAA CAGTATTGCC AAAAGTAGAG GCTGTATTCG AATAAATTTT TCATCAACTA 6 60 

GTATTCGGGG GGAATAAAGT ATATGGAAAT TTTACGTATA GAGCCAACAC CAAGTCCAAA 720 

TACAATGAAA GTTGTTTTGT CATATACAAG AGAAGACAAG TTATCTAATA CTTATAAAAA 780 

AGTAGAAGAA ACACAACCAA GATTTATAAA TCAGTTGTTA TCTATAGATG GTATCACTTC 84 0 

CATTTTTCAT GTCATGAACT TCTTAGCTGT TGATAAGGCA CCAAAAGCTG ATTGGGAAGT 900 

CATATTACCT GATATTAAAG CTGCTTTTTC TGATGCGAAT AAGGTTTTAG AATCTGTAAA 960 

TGAACCTCAA ATTGACAATC ATTTTGGTGA AATTAAAGCT GAATTATTAA CTTTT A AGGG 1020 

TATACCGTAT CAAATTAAGC TAACTTCTGC TGACCAAGAA TTAAGAGAAC AATTACCACA 10 80 

AACATATGTT GACCATATGA CTCAAGCGCA AACAGCACAT GACAATATTG TTTTTATGCG 114 0 

TAAATGGCTA GATTTAGGAA ATCGCTATGG AAATATTCAA GAAGTAATGG ATGGTGTCCT 1200 

AGAAiGAAGTG CTAGCTACCT ATCCAGAATC ACAGTTACCC GTATTGGTAA AACATGCTTT 1260 

40 AGAAGAAAAT CACGCAACTA ATAATTATCA TTTCTATCGA CATGTCTCTT TGGATGAATA 13 20 

TCATGCAACT GATAATTGGA AGACTCGATT ACGAATGTTA AACCATTTTC CAAAGCCGAC 13 8 0 

TTTTGAAGAT ATACCGCTGC TTGATTTAGC TTTATCTGAT GAAAAAGTAC CGGTTAGACG 14 4 0 

TCAAGCGATT GTATTATTAG GTATGATTGA AAGTAAAGAA ATTTTACCGT ATTTATATAA 1500 

GGGGCTTCGT GATAAAAGTC CTGCTGTAAG AAGAACAGCA GGGGATTGCA TAAGCGATTT 1560 

AGGGTATCCA GAGGCACTAC CAGAAATGGT G CT ACT ATT A GATGATCCAC AGAAAATCGT 16 20 

TAGGTGGCGT GCTGCTATGT TTATCTTTGA TGAAGGTAAT GCAGAGCAGC TTCCCGCACT 1680 

AAAAGCCCAT ATTAATGACA ATGCGTTTGA AGTTAAATTA CAAATTGAAA TGGCCATATC 174 0 
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AATTTAATTG GAGGAATTAA ATATGAATGC ATATGATGCT TATATGAAAG AAATTGCGCA i860 

ACAAATGCGT GGCGAATTAA CTCAAAATGG TTTTACAAGT TTAGAAACGA GCGAACAGct 1920 

ATCGGAGTAT ATGAACCAAG TAAATGCTGA TGACACTACT TTTGTAGTTA TTAACTCTAC 1980 

ATGCGGCTGT GCAGCTGGAT TAGCAAGACC AGCTGCAGTA GCAGTTGCAA CACAAAATGA 204 0 

ACATAGACCT ACAAATACAG TTACAGTTTT TGCTGGGCAA GATAAAGAAG CAACTGCTAC 2100 

AATGCGAGAA TTCATTCAGC AAGCACCATC TAGTCCTTCG TATGCTTTAT TCAAAGGTCA 216 0 

AGATTTAGTT TATTTTATGC CTAGAGAATT TATCGAAGGT AGAGATATTA ATGACATTGC 2 220 

AATGGACTTA AAGGATGCCT TTGACGAAAA TTGTAAATAG TACACATAAA TAAATATAAA 2280 

GGTTAACACA TTTTATAATA TTAAAAATGG TGTCTGTCAT TGAAAATAGA GAATATAGTT 234 0 

GTATTCTATT TGTTAAATAA AGTCCGTTTT TACCaACTAT ATTTTCTAGA AATTTAACTG 24 00 

20 TTTTAATAGG ACATCAAACA TAATATT CaA ATCaTGTGTT AACCTCTTTT TTAAA A TTTT 2460 

TTAGCATTAA AGTTATAGAT TTGGGTAAAC AATTACCAAT TGGAAACATA TATCACGTTA 2520 

CGATGGGGTA GGTACTTAAT CAGCATTTTA TAAATAAAGT AACGGAATTC ATGATATTAA 2580 

TATCATATTC CTAAAATGAG TGATAACAAA ATGCTACATA AAGTTAAGTT ATATCAAACT 264 0 

AAATATACAT ACTATAAATA ATGAAAATGA GGTGTTATCG CATATGTTGA ATTCATTTGA 2700 

TGCAGCATAT CACAGTCTTT GTGAAGAAGT TTTAGAAATA GGAAATACAC GAAATGATCG 2760 

CACAAATACA GGTACGATTT CGAAATTTGG TCATCAACTT CG CTTTG ACT TATCTAAAGG 2820 

ATTTCCACTA TTAACGACAA AGAAAGTTTC TTTTAAATTA GTAGCAACCG AATTATTATG 2880 

GTTCATTAAA GGAGATACAA ACATCCAATA CTTATTAAAA TATAATAATA ATATATGGAA 2940 

CGAATGGGCT TTTGAAAATT ATATCAAATC AGACGAGTAT AAAGGTCCAG ATATGACAGA 3000 

TTTC33GGCAT CGTGCATTGA GTGATCCTGA ATTTAACGAA CAATATAAAG AACAAATGAA 3060 

40 ACAATTTAAG CAACGTATTC TTGAAGATGA TACATTTGCG AAGCAATTCG GGGATTTAGG 3120 
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AAATGTTTAT GGTAAACAAT GGCGAGATTG GGTTGATAAA GATGGTAATC ATTTTGATCA 3180 

ACTTAAAACA GTAATTGAAC AAATTAAGCA TAATCCAGAT TCAAGGCGAC ACATCGTATC 3240 

45 TGCATGGAAT CCAACAGAAA TTGATACAAT GGCACTTCCG CCTTGTCATA CCATGTTCCA 3300 

GTTTTATGTC CAAGATGGTA AGTTAAGTTG CCAGTTATAC CAACGTAGCG CAGATATCTT 3360 

TTTAGGTGTG CCATTTAATA TCcGCagctA CGCTTTATTG ACACACCTTA TTGCCAAAGA 3420 

50 

ATGTGGACTT GAAGTGGGTG AATTTGTGCA TACATTTGGA GATGCACATA TTTATTCAAA 34 80 

TCATATTGAT GCGATTCAAA CACAATTAGC ACGTGAAAGC TTCAATCCTC CAACATTAAA 354 0 
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TGAATCACAT CCAGCAATAA AAGCTCCAAT AGCAGTGTAG TCATTGCATA GTTAGCTAAC 3660 

CATATAGACA TCAAAATGAC AT CAT AGT AT TTTCAAGTGC AAAAAAGTAC TTTTTTGTGT 3720 

TAAACGTTTT CATAAATTAT GCAAAATCAT TATTTCTATC ACACTTTATG ATAAAAATTG 3780 

TGTTAAATTA AAGATAACTT AGTAATAAAA AATGAAATGA TAGAAGAAGG AGGATAATTA 384 0 

TGACTTTATC CATTCTAGTt GCACATGACT TGCAACGAGT AATTGGTTTt GAAAATCAAT 3 900 

TACCTTGGcA CCTACCAAAT GATTTGAAGC ATGTTAAAAA ATT AT CAACA GGTCATACTT 3960 

TAGTAATGGG TCGTAAGACA TTTGAATCGA TTGGTAAACC ACTAC CGAAT CGTCGAAATG 4 02 0 

TTGTACTTAC TTCAGATACA AGTTTCAACG TAGAnGGCGT TGATGTAATT CACTCTATTG 4 080 

AAGATATTTA CCAACTACCG GGCCATGTTT TCATATTTGG AGGGCAAACA TTATTTGAAG 414 0 

AAATGATTGA TAAAGTGGAC GACATGTATA TTACTGTTAT TGAAGGTAAA TTCCGTGGTG 4200 

20 ATACGTTCTT TCCACCTTAT mCATTkGAgr CTGGGAAGTT GCCTCTTCAG TTGAAGGTAA 4260 

ACTAGATGAG AAAAATACAA TTCCACATAC CTTTCTACAT TTAATTCGTA AAAAATAAGG 4 320 

GGGAAAACGA CCATGACAAA ACAGATTATA GTAACAGACT CAACATCCGA TTTATCTAAA 43 80 

GAATACTTAG AAGCAAACAA CATTCATGTA ATTCCTTTAA GTTTAACTAT TGAAGGAGCT 444 0 

TCATACGTTG ACCAAGTAGA TATTACATCA GAAGAATTTA TTAATCATAT TGAAAATGAT 4 500 

GAAGATGTAA AGACAAGTCA GCCAGCCATA GGTGAATTTA TATCTGCTTA TGAAGAACTA 4 560 

GGAAAAGATG GCTCTGAAAT CATAAGTATT CATCTTTCTT CAGGATTAAG TGGTACATAT 4 620 

AACACTGCTT ACCAAGCAAG TCAAATGGTA GATGCTAATG TAACTGTTAT TGATTCAAAA 4680 

TCTATTTCTT TTGGTTTAGG GTATCAAATA CAACACCTAG TAGAGCTTGT AAAAgAaGGT 474 0 

GtCTCAACTT CTGAAATAGT TAAAAAGTTA AATCATTTAA GAGAAAACAT TAAATTATTT 4 800 

GTAGTTATAG GGCAATTGAA TCAATTAATT AAAGGTGGCA GAATTAGTAA AACAAAAGGT 4 860 

TTGATTGGTA ATCTTATGAA AATTAAACCA ATTGGTACAC TAGATGATGG TCGCTTAGAG 4920 

CTTGTGCmCA ATGCGAGAAC TCaAAATTCk AGTATCCAAT ACTTGAAAAA GGAAATTGCT 4 980 

GAATTTATAG GAGATCATGA AATCAAATCC ATTGGTGTCG CACATGCTAA CGTCATTGAA 5040 

45 TATGTTGATA AATTGAAGAA AGTTTTTAAT GAAGCTTTTC ATGTGAATAA TTACGATATA 5100 

AATGTAACTA CACCAGTTAT TTCTGCACAT ACTGGTCAAG GTGCGATTGG CCTCGTAGTC 5160 

CTTAAGAAGT AAATTTAATC TTTTCAGTGT TAATTACTTC CATTTCAATC CTTTATAGAC 5220 

SO 

TAAATTTATA ATTAGATAGA TAGAGGAGGT AATTCATATG ACAAAAGAAT ATGCAACATT 5280 

AGCAGGAGGA TGTTTCTGGT GCATGGTTAA ACCATTTACA TCATATCCAG GCATCAAGTC 534 0 
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GAATCAAACC GGCCATGTCG AAGCAGTACA AATTACGTTT GATCCAGAGG TTACTTCCTT 5460 

TGAAAATATA TTAGACATAT ATTTCAAAAC ATTTGACCCA ACTGATGATC AAGGGCAATT 5520 

5 

TTTCGATAGA GGCGAAAGCT ATCAACCAGT CATTTTCTAT CATGATGAAC ATCAGAAAAA 5580 

GGCTGCTGAG TTTAAAAAGC AACAATTAAA TGAACAAGGT ATTTTCAAGA AACCAGTGAT 564 0 

TACAC CT ATT AAACCATATA AAAATTTCTA TCCAGCTGAA GACTACCATC AAGATTATTA 5700 

10 

CAAAAAGAAC CCGGTACATT ATTACCAATA TCAACGTGGT TCAGGTAGAA AAGCGTTTAT 5760 

AGAAT CACAT TGGGGGAATC AAAATGCTTA AAAAAGATAA AAGTGAACTA ACAGATATAG 5820 

1S AATATATTGT TACACAAGAn AACGGCACTG AACCACCATT TATGAATGAA TATTGGAATC 5880 

ATTTTGCTAA AGGATTTATG TAGATAAAnT TCnGGTAAAC CTTG 5924 
(2) INFORMATION FOR SEQ ID NO: 131: 

20 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9280 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 . • 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 131: 

GGCCGTTnAA AATCTCCAAA ATAnAAAAAC CCATCTTGTT CCAATGTTTT AAAATCGCCa 60 

30 

TCCaACACTT GaTCaATAGC TTGCAACAAC GTTGAACGTG TTTTaCCAAA AGCATCaAAC 120 

GCTCCCACTA AAATCAGTGC TTCAAGTAAC TTTCTCGTTT TGACTCTCTT CGGTATACGT 180 

CTAG CAAAAT CAAAGAAATC TTTAAATTTG CCGTTCTGAT AACGTTCATC AACAATCACT 24 0 

35 

TTCACACTTT GATAACCAAC ACCTTTAATT GTACCAATTG ATAAATAAAT GCCTTCTTGG 300 

GAAGGTTTAT AAAACCAATG ACTTTCGTTA ATGTTCGGTG GCAATATAGT GATACCTTGT 360 

40 TTTTTTGCTT CTTCTATCAT TTGAGCAGTT TTCTTCTCAC TTCCAATAAC ATTACTTAAA 420 

ATATTTGCGT AAAAATAATT TGGATAATGG ACTTTTAAAA AGCTCATAAT GTATGCAATT 480 

TTAGAATAGC TGACAGCATG TGCTCTAGGA AAACCATAAT CAGCAAATTT CAGAATCAAA 54 0 

45 TCAAATATTT GCTTACTAAT GTCTTCGTGA TAACCATTTT GCTTTGCACC TTCTATAAAA 600 

TGTTGACGCT CACTTTCAAG AACAGCTCTA TTTTTTTTAC TCATTGCTCT TCTTAAAATA 660 

TCCGCTTCAC CATAACTGAA GTTTGCAAAT GTGCTCGCTA TTTGCATAAT TTGCTCTTGA 720 

SO 

TAAATAATAA CACCGTAAGT ATTTTTTAAT ATAGGTTCTA AATGCGGATG TAAATATTGA 780 

ACTTTGCTTG GATCATGTCT TCTTGTAATG TAAGTTGGAA TTTCTTCCAT TGGACCTGGT 84 0 
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ACACTTCTTA 


CACCGTCAGA 


CTCTAATTGG 


AATATGCCAG 


TCGTATCTCC 


TTGCGACAAC 


960 




AATTCAAACA 


CTTTTTGATC 


ATCAAACGGA 


ATCTTTTCGA 


TATCAATATT 


AATACCTAAA 


1020 


5 


TCTTTTTTGA 


CTTGTGTTAA 


GATTTGATGA 


ATAATCGATA 


AGTTTCTCAA 


CCCTAGAAAA 


1080 




TCTATTTTTA 


ATAACCCAAT 


ACGTTCGGCT 


TCAGTCATTG 


TCCATTGCGT 


TAATAATCCT 


1140 




GTATCCCCTT 


TCGTTAAAGG 


GG CATATTCA 


TATAATGGAT 


GGTCATTAAT 


AATAATTCCT 


1200 


10 


GCCGCATGTG 


TAGATGTATG 


TCTTGGTAAA 


CCTTCTAACT 


TTTTACAAAT 


ACTGAACCAG 


1260 




CGTTCATGTC 


GATGGTTTCG 


ATGTACAAAC 


TCTTTAAAAT 


CGTCAATTTG 


ATATGCTTCA 


1320 


15 


TCAAGTGTAA 


TTCCTAATTT 


ATGTGGGATT 


AAACTTGAAA 


TTTCATTTAA 


TGTAACTTCA 


1380 


TCAAACCCCA 


TAATTCTTCC 


AACATCTCTA 


GCAACTGCTC 


TTGCAAGCAG 


ATGACCGAAA 


1440 




GTCACAATTC 


CAGATACATG 


TAGCTCGCCA 


TATTTTTCTT 


GGACGTACTG 


AATGACCCTT 


1500 


20 


TCTCGGCGTG 


TATCTTCAAA 


GTCAATATCA 


ATATCAGGCA 


TTGTTACACG 


TTCTGGGTTT 


1560 




AAAAAACGTT 


CAAATAATAG 


ATTGAATTTA 


ATAGGATCAA 


TCGTTGTAAT 


TCCCAATAAA 


1620 




TAACTGACCA 


GTGAGCCAGC 


TGAAGAACCA 


CGACCAGGAC 


CTACCATCAC 


ATCATTCGTT 


1680 


25 


TTCG CAT AAT 


GGATTAAATC 


ACTTACTATT 


AAGAAATAAT 


CTTCAAAACC 


CATATTAGTA 


1740 




ATAACTTTAT 


ACTCATATTT 


CAATCGCTCT 


AAATAGACGT 


CATAATTAAG 


TTCTAATTTT 


1800 




TTCAATTGTG 


TAACTAAGAC 


ACGCCACAAA 


TATTTTTTAG 


CTGATTCATC 


ATTAGGTGTC 


1860 


30 


TCATATTGAG 


GAAGTAGAGA 


TTGATGATAT 


TTTAATTCTG 


CATCACACTT 


TTGAGCTATA 


1920 




ACATCAACCT 


GCGTTAAATA 


TTCTTGGTTA 


ATATCTAATT 


GATTAATTTC 


CTTTT CAGTT 


1980 




AAAAAATGTG 


CACCAAAATC 


TTCTTGATCA 


TGAATTAAGT 


CTAATTTTGT 


ATTGT CTCT A 


2040 


35 


ATAGCTGCTA 


ATGCAGAAAT 


CGTATCGGCA 


TCTTGACGTG 


TTTGGTAACA 


AACATtTTGA 


2100 




ATCC^AACAT GTTTTCTACC 


TTGAATCGAA 


ATACTAAGGT 


GGTCCATATA 


TGTGTCATTA 


2160 


40 


TGGGTTTCAA 


ACACTTGTAC 


AATATCACGA 


TGTTGATCAC 


CGACTTTTTT 


AAAAATGATA 


2220 


ATCATATTGT 


TAGAAAATCG 


TTTTAATAAT 


TCAAACGACA 


CATGTTCTAA 


TGCATTCATT 


2280 




TTTATTTCCG 


ATGATAGTTG 


ATACAAATCT 


TTTAATCCAT 


CATTATTTTT 


AGCTAGAACA 


2340 


45 


ACTGTTTCGA 


CTGTATTTAA 


TCCATTTGTC 


ACATATATTG 


TCATACCAAA 


AATCGGTTTA 


2400 




ATGTTATTTG 


CTATACATGC 


ATCATAAAAT 


TTAGGAAAAC 


CATACAATAC 


ATTGGTGTCA 


2460 




GTTATGGCAA 


GTGCATCAAC 


ATTTTCAGAC 


ACAGCAAGTC 


TTACgGCATC 


TTCTATTTTT 


2520 


SO 


AAGCTTGAAT 


TTAACAAATC 


ATAAGCCGTA 


TGAATATTTA 


AATATGCCAC 


CATGATTGAA 


2580 




TGGCCCCTTT 


CTATTAGTTA 


agttttutgc 


GTAAAGCTGT 


AGCAAGTTGC 


TCAAATTCAT 


2640 
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CAATATCATT 


AATAATCAAT 


TGCCCTTTAG 


AACGTAATCG 


ACATCTGATT 


TCATTACCTT 


2760 




CATCGACTGC 


AAATACCCAT 


ATTTTCAAGC 


CTTTGATGTC 


AGCAATTGTA 


TTAACAAACT 


2820 


5 


GAGATGCTTC 


ATTTGGCTGA 


ATACCGAATT 


GCTCCAATAC 


ATCTTCAGTT 


ATTTTAACTT 


2880 




GGCAGAATCC 


ATCATCCATA 


AGTTCGAAAT 


GTTGTAAAAC 


ATAACCTTGA 


AACGGCAACA 


2940 


10 


TTTTTGGGTC 


CTTCTCCATC 


ATTTTATTTA 


AAAGCG CATT 


ATGATCAATA 


TCATGC CCAA 


3000 


TTAACTTTCC 


AGCAATTTCC 


ATAGTATGTT 


CTGAGGTATT 


GTTAAAAAGG 


AATCGCCCAG 


3060 




TATCACCGAC 


GATACCAAGA 


TATAAAACGC 


TCGCGATATC 


TTTATTAACA 


ATTGCTTCAT 


3120 


15 


CATTAAAATG 


TGAGATTAAA 


TCGTAAATGA 


TTTCACTTGT 


AGATGACGCG 


TTCGTATTAA 


3180 


CTAAATTAAT 


ATCACCATAC 


TGATCAACTG 


CAGGATGATG 


ATCTATTTTA 


ATAAGTTTAC 


3240 




GACCTGTACT 


ATAACGTTCA 


TCGTCAATTC 


GTGGAGCATT 


GGCAGTATCA 


CATACAATTA 


3300 


20 


CAAGCGCATC 


TTGATATGTT 


TTATCATCAA 


TGTT AT CTAA 


CTCTCCAATA 


AAACTTAATG 


3360 




ATGATTCCGC 


TTCACCCACT 


GCAAATACTT 


GCTTTTGCGG 


AAATTTCTGC 


TGAATATAGT 


34 20 




ATTTTAAACC 


AAGTTGTGAA 


CCATATGCAT 


CAGGATCTGG 


TCTAACATGT 


CTGTGTATAA 


3480 


25 


TAATTGTATC 


GTTGTCTTCG 


ATACATTTCA 


TAATTTCATT 


CAAAGTACTA 


ATCATTTTCA 


3540 




TACTCCCTTT 


TTTAGAAAAG 


TTGCTTAATT 


TAAGCATTAG 


TCTATATCAA 


AATATCTAAA 


3600 




TTATAAAAAT 


TGTT ACT AC C 


ATATTAAACT 


ATTTGCCCGT 


TTTAATTATT 


TAGATATATA 


3660 


30 


TATTTTCATA 


CTATTTAGTT 


CAGGGGCCCC 


AACACAGAGA AATTGGACCC 


CTAATTTCTA 


3720 




CAAACAATGC 


aAGTTGGGGT 


GGGGCCCCAA 


CGTTTGTGCG 


AAATCTATCT 


T ATG C CT ATT 


3780 


35 


TTCTCTGCTA 


AGTTCCTATA 


CTTCGTCAAA 


CATTTGGCAT 


ATCACGAGAG 


CGCTCGCTAC 


3840 


TTTGTCGTTT 


TGACTATGCA 


TGTTCACTTC 


TATTTTGGCG 


AAGTTTCTTC 


CGACGTCTAG 


3900 




TATGCCAAAG 


CGCACTGTTA 


TATGTGATTC 


AATAGGTACT 


GTTTTAATAT 


ACACGATATT 


3960 


40 


TAAGTTCTCT 


ATCATGACAT 


TACCTTTTTT 


AAATTTACGC 


ATTTCATATT 


GTATTGTTTC 


4020 




TTCTATAATA~ 


CTTACAAATG 


CCGCTTTACT 


TACTGTTCCG 


TAATGATTGA 


TTAAAAGTGG 


— 4-0 8 0" 




TGAAACTTCT 


ACTGTAATTC 


CATCTTGATT 


CATTGTTATA 


TATTTGGCGA 


TTTGATCGTT 


4140 


45 


AATTGTTTCA 


CCCATCTGAG 


GCTGTCTTCC 


TAAAAGTTGC 


ATAGACTTTA 


AAACATCTTG 


4200 




TCTATTAATC 


ACACCCACTG 


TCTTTTTATT 


ACTCGAAACG 


ACAGGAATCA 


ATTCAATACC 


4260 




TTCCCAAATC 


AT CAT ATG CG 


CACAACTTGC 


TACTGTACTC 


ATAGCATTTA 


CATAAATAGG 


4320 


SO 


ATTTCGCGTC 


ATCACTTTAT 


CTATTTCGTC 


GTCGTCCTTT 


GTATTAATCA 


TCTCTCGACT 


4380 




TGTTACAATA 


CCTACTAATT 


TATACGACTC 


ATTGACTACC 


GGAAATCTTG 


TATGGCCAGT 


4440 
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ATCTAATGGC GTCATTATAT CTTGAACTAT TAAGATATCT TTTCGTATTT TCTGATTAAA ~ 4 560 

AAGTGCTTTG TTGATAATAT TTGCAACTAG GAATGTATCA TAACTTGATG ATAGAACAGG 4620 

TAAATCATGT TCATTCGCAA AATTAATAAC TTTATTAGAT GGCTTAAATC CACCAGTAAT 4680 

TAATATAGCC GTACCTCTTT TTAAAGCTTC AATCTGCACA TCTTCACGAT TTCCGACAAT 4740 

CAATAATGTC TTTGGACCAA TATACTTTAA AATATCTTTG AGTTCCATTG CTCCAATTGC 4 800 

AAATTTAGAT ACCATCTTAG TG AT AC CTTT GTTGCCACCT AACACTTGGC CAT CAAT AAT 4 860 

ATTGACAATT TCATTAAAAG TT AAATGTT C AATTTCATTA CGATTACGTT TTTCGATTCG 4 920 

AACCGTACCA ACACGATCTA TCGTTGCGAC CATGCCCATT TTATCAGCAT CTTTmATTGc 4 98 0 

ACGATATGCT GTCCCytCaG ATACGTTTAA AAATTTAGCG ATTTTACGCA CCGAAATTTT 5040 

AGAGCCTATA GATAACGATT CAATATAATC TAAAATTTGT TCATGTTTTG TCATTCTTTA 5100 

CCTCTTCTTT TCGAACAGTA TTAACTACAT TATAACTTTA TTTTGGATAA AAAGCATTGA 5160 

AGTGAAATGA AATAATGATC GTT t CACCTA TTTTATTTTT TGAAAATATA CAACAAACAC 5220 

AAAGATCACA AAATCTTTAA TTTTAAATGG AAAAATCCAT TATTATTTAT TAGAATGTAA 5280 

2S GTGAGGAGGG ATGTACTAAT GTATAAAAAT ATATTACTTG GTGTAGACAC TCAGTTAAAA 5340 

AATGAAAAAG CACTAAAAGA AGTGTCTAAA TTAGCTGGCG AAGGTACAGT CGTAACAGTT 54 00 

TTAAACGCAA TCAGCGAACA AGaTGCTCAA GCATCAATTA AAG CAGGTGT TCATTTAAAC 5460 

30 AAACTTACTG AAGAACGAAG CAAGCGATTG GAAAAAACAC GCAAAGCTTT AGAAGATTAT 5520 

GGTATTGATT ATGACCAAAT AATTGTTCGT GGTAATGCAA AAGAAGAACT ATTAAAACAT 5580 

GCTAATAGCG GTAAATATGA AATTGTTGTT TTAAGTAACC GTAAAGCAGA AGACAAAAAG 564 0 

AAATTTGTAC TTGGAAGTGT CAGCCACAAA GTAG CAAAAC GTG CGACTAT CCCTGTATTA 5700 

ATCQJTAAAT AAAATTTTTA TCCAGAATCA CAAATAATCT TTCAATCATG ATGCAGTCTC 5760 

AAACGACTGA GTAAATACAA GAAACGATTA TGACTGTGGT TCTGGATTTT TTATATCGTA 5820 

GTAAATTTAT AATCAATGTC TAATTGTATA AAACTAAAAT TACGAGAGTA GGTCAGAAAT 5 880 

GATAAAGAAC CACTGATGTC CCCCGTCCAC GTCGTAACTG AATCAGTAGA ATATAAAAAC 594 0 

ACCCACTAAA AATATGCAGA CGATAACTTC CACATAGATT AGCGAGGTGT TTTTTAGTGT 6000 

AAAATCTATA TTCTATTTAA AACTGAACAG ATTCACCTGG TTTTAAAATT TGCACGTCCC 6060 

CTACATTAAC AG CATCTTTA AATTGTTGTG GATCTTGTTC GATTAATGGG AATGTATCAT 6120 

AATGAATCGG TACAGAAATT TTTGGTTTAA TAAATTCATT AATAGCATAA CTTGCATCAT 6180 

CAATACCCAT CGTAAAATTA TCTCCAATTG GTACAAAACA TACATCAACT GGATGACGTT 624 0 
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TTCAACTTCA 


AACACGATAC 


CCATTGGCAT ACCTAAATAA ACTGGgAATA CCATTTTCAT 


6360 




GTGTAAAACT 


TGAACTATGA 


AATGCTTGAA 


CAAATTTAAC 


GCTTCCGAAA 


TCAAaGTTTG 


6420 


5 


CTTTACCACC 


AaTATTCATA 


CCATGAACAT 


TTTCAACACC 


GTGATATGAA 


GAAAGATAGT 


6480 




CAGCCATTTC 


TGCACTTCCA 


ATTACTGTTG 


CTCCTGTTTT 


CTTTGCTAGT 


TCCACAACAT 


6540 


10 


CACCAAAATG 


ATCAAAATGA 


CCGTGCGTTA 


AAACGATATA 


GTCTACCTGC 


ACTGTTTCAA 


6600 


TATTCAAATC 


ACACTTAnnn 


TTATTTGAAA 


TAAACGGATC 


TACGATAACC 


TTTTTGTTGT 


6660 




TCCCTTCTAA 


ATAAATrnTT 


GATTGACCAT 


GAAATGATAA 


CTTCATTTGA 


GCATCCTCCT 


6720 


15 


ATCAATTAPT 


AT ATA A ATTT 
n x nx nnn X X X 


AGTACCCTTT 


TGCCACTTAA 


TTATAACAAA 


TTCTCAAATT 


6780 


TTAAAAATTG 


AAAATOTAfST 


TAATGTATTA 


GCTCGATTTT 


GAAATCTAAT 


AATAATTGGC 


6840 




ATAAAATGGA 


AGTAATATTA 
•TVtj x nn X n X X n 


TGTTGAGGAG 


TGTTTATAAA 


ATGACAAAAA 


TATCAAAAAT 


6900 


20 


AATAGACG AA 


x iVjnnLJvilL 


AACAAGCTGA 


TGCAGCATGG 


ATTACAACAC 


CGTTGAATGT 


6960 




ATATTATTTT 
-nxnx xnx xxx 




GTAGCGAACC 


CCATGAAAGA 


TTATTTGCAT 


TATTGATTAA 


7020 




GAAAGATGGT 


AAAOAAOTAr" 


TATTTTGTCC 


AAAAATGGAA 


GTCGAAGAAG 


TCAAAGCATC 


7080 


25 




V7vj x vxrvw* x 


TTGGATATTT 


AGACACTGAA 


AAcccrrrrr 


CACTTTATCC 


7140 




TCAAAPAATP 


A AT A 71 HTT2V C* 


TAATTGAAAG 


CGAGCACTTA 


ACAGTAGCAC 


GCCAAAAACA 


7200 




ATTAAT t U T*( L " V 


vjvj xxx LnniV} 


TCAATTCATT 


CGGAGATGTT 


GATTTAACAA 


TCAAACAATT 


7260 


30 


GAGAAATATT 
x f \ x x 


A A ATfTT! H 


ATGAAATTAG 


CAAAATACGT 


AAAGCTGCTG 


AGTTAGCAGA 


7320 




TAAGTGTATC 


G A A AT A firtTYi 


TTTCTTATTT 


AAAAGAAGGT 


GTGACTGAAT 


GTGAAGTAGT 


7380 




CAAC CAT ATT 




TCAAACAATA 


TGGCGTCAAT 


GAAATGAGTT 


TTGATACGAT 


7440 


35 


GorrriATTT 


GGAGATCATG 


CCGCATCACC 


TCATGGCACA 


CCAGGAG ATC 


GCAGATTAAA 


7500 




AAGCAATGAA 


TATGTACTAT 


TTGATTTAGG 


TGTAATTTAT 


GAGCATTATT 


GTAGCGATAT 


7560 


40 


GACACGTACT 


ATTAAATTTG 


GTGAACCTAG 


CAAAGAAGCA 


CAAGAAATTT 


ATAATATTGT 


7620 


ATTAGAAGCA GAAAOttCTG CAATCCAAGC AATTAAACCT GGAATACCAT TAAAAGAT AT 


7680 




CGATCATATC 


GCTAGAAATA 


TTATTTCAGA 


AAAAGGTTAT 


GGTGAATATT 


TCCCTCATCG 


7740 


45 


CTTAGGTCAT 


GGCCTAGGAT 


TACAAGAACA 


TGAATATCAA 


GATGTTTCAA 


GTACTAATTC 


7800 




TAATTTGTTA 


GAAGCTGGCA 


TGGTTATTAC 


AATCGAACCA 


GGTATTTATG 


TACCTGGTGT 


7860 




TGCAGGTGTA 


AGAATTGAAG 


ATGACATACT 


TGTCACTAAT 


GAAGGATATG 


AAGTATTAAC 


7920 


SO 


ACATTACGAA 


AAATAAGGAG 


TGGGATAAAA 


ATGAAAAGCT 


TGTTACAAGC 


GCATTCTCAT 


7980 




TCAGTCAAAC 


ACTGCCAATA 


TAACATTGTA 


GCGCCTAAGA 


CATAAATTTT 


TATCCAAGTC 


8040 
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20 



25 
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40 



TGTAATGAAT CAAATCAATA TCATTCATGT TCGATGATTT CTTCGCATTG TTTCTAGCTT 
TAATTTATCA TTATTTAATT TTAATAACCA AGGAGATGAT AACGTCATTC TTTAGTACGC 
TGTAATCCAT TCCCTTTTCA TCAAATTCAA ATTATAATTG TAATGCTTCT TCTACAGATT 
TATATTCCAT TTCAAATGCC TCTGCAACGC CTTTATTGGT TACGTGACCT TTGTAAGTAT 
TTAAACCTAA TGATAATGGT TGATTTGATT TAAATGCTTC TCTATACCCT TTATTAGCTA 
GCATGAGCGC ATAAGGTAGC GTAgCATTAT TTAAAGCTAA CGTCGAAGTA CGCGGTACTG 
CACCTGGCAT ATTTGCAACT G CAT AATGAA CCACACCATG CTTAATATAT GTAGGATCAT 
CATGTGTCGT AATTTTATCA GTTGtTTCAA AAATACCGCC TTGATCAATA GCAATGTCAA 
TAATAACTGA CCCATTTTTC ATTTGTTTAA TCATGTCTTC TGTTACAAGT CTTGGCGCTT 
TAGCAC CTGG AATTAAAACT GCACCTATTA CTAAATCACT TTGTTTAACA TACAACTCAA 
TATT CAACGG ATTTGACATA ATTGTATGTA CACGTCCACC GAATAAATCA TCTAATTGTT 
GTAAACGCTT TGGATTAACA TCTAAAATCG TAACATCTGC ACCTAGTCCT AGTGCAATTT 
TAG CTG CATT TGTTCCTGCT TGACCACCAC CGATAATAGT TACTTTACCC TTAGGTACTC 
CTGGGACACC ACCTAGTAGA ATTCCCATAC CACCATTAAG TTTTTGTAGG AACTCTGCGC 
CAACTTGAGC TGACATTCTT CCTGCTACCT CACTCATTGG TGATAACAAT GGTAAAGATC 
GGTCTGGTAA CTGCACAGTC TCATATGCAA TACTAATTAC TTTTCTATCT ATCAAAGCTT 
GTGTTAATTT TTCTTCATTT GCTAAATGAa gatAaGTGAA TAATACAAGC CCTTCTTTAA 
AATATGGATA TTCAGATTCA AGTGG TTCTT TAACTTTAAT AACCATATCC ACATCCCAAA 
CTTTTGCTTG TTCAGCAACA ATCTCAGCAC CTGCTTCTTT GTAATCTACA TCTTCAAAGA 
ATGATCCTGA ACCCGcATTT GTTTCCACTA AAACAGTATG 
(2) INFORMATION FOR SEQ ID NO: 132: 

<i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4669 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY : linear 



8160 
8220 
8280 
8340 
8400 
8460 
8520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9280 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 132: 

CTGATTAATC TCTTGTTGTC GTGTATTTAC TAATTGAATC GTTGGTGTCT GAACACGTCC 6 0 

CAGGGATAGC TGTGCATCAT ACTTTGTTGT TAGTGCACGC GTTGCATTAA TCCCAACAAT 120 

CCAATCTGCC TCACTTCTCG CTAACGCTGC ATAATACAAA TCGTTATATT GACOACCGTC 18 0 
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ACGGATTGGC 


' TTTTTGTTAC 


PAAl "ITT ATP 
X X X A x V— 


PA A A ATP A AT 


t "iTftraapTn 

v- 1 luV-nnL 1 A 


GTTCACCTTC 


300 




TCGTCCaGCA TCTGTTGCAA 


TAATAATATP 
* nrx x nn x a x ^ 


^P^P^P^^ TA ^TTTl 
111 V— A\— 1 1 In 


TT ATPTA A & & 
1 1 A 1 V» 1 AAAA 


TTAACGCTTT 


360 


5 


TACTGTTTTA 


AATTGTTTGC 


TTGTttt AP P 


A ATA A PA APA 
AA InnUvaUA 


vjl l 1 1V-A1A1 


ATTTAGGTAT 


420 




AATTGGAAGG 


TCTTCTAATC 


GCCATTCCTT 


XAAAX X X X 1A 


TPY1T A TTflTT 
1 wVj 1 A 1 1\» 1 1 


CAGGTGT CGC 


480 




ATTTGTCACT 


AGATGACCTA 


ACGCPPAPGT 


f2APA ATATAT 
OnLnn 1 A 1 A 1 


lVJUX 1 A.1 1 1 1 


T\ TV TV / " 1 »TV TV 

CAAAGTAAC C 


540 


10 


ATTACGCTTC 


TGATTTATTT 


GTAAAGCATC. 


AfSPAATATPT 

A\j\— AA X A L V_ 1 


PTTPPP 7A / m I »/■"» 


ATGGTTTTTC 


600 




AG CT AAT ATT 


AAAGATTTCA 


TAAATTATPP 


ills. 1 Lftl/iL 


GTTCTTTTAT 


TTCGAACGTG 


660 


15 


CTTCATCTAT 


TCCACTAATC 


TTTGATTTAA 
x x xvjlax x inn 


A TT P A A TV* A T 
All Uin 1 Vja 1 


IVfLAAATGAT 


GTGTTAAATG 


720 


TATTGTAACA 


TGTTAATATC 


x n X X AAV. X 


1 1 V—M. Ill l~AVJ 


•WP TA TV TA »T»TV 


ATATAATAAA 


780 




AGTAACAAAA 


AGTACGGAGG 


T AATP. A P A*TY2 
X AA x vtA\_A X w 


AvjuAiAu 11L 


TV 1 " I'TV TV^ fv 

AUTTATATGA 


TATTACACAA 


640 


20 


ATAAAATCGT 


TCATTGAACA 


x x v_unn X X AX 


flA ATP APT* AT 
vxaa l C-aIjCa 1 


CATACTTATA 


TAAACTTCCT 


900 




CAACAGTACA 


ATGAAATAGA 


TfJT A TT A A T A 
XvXXAX X AAXA 


Ml» v» Ija x\? UviA 


*p»py"» TV TV *r*f+ TV f*/* 

1 1GAATCACC 


TGGTGTATTT 


960 




TCGATTAAAG 


AAAACGATTC 


AATPAAAfiPA 
aa.x v^nnnvjWt 


A TP A T A TTT TP 
A 1 W\ 1 A 1 1 \J 1 


CTTTTGCATA 


CGATAAAAAT 


1020. 


25 


AAATTCAAAG 


TCATAGGCCC 


TH N I *PrtTY"2f2PT 

XXX X OV?V_ 1 


unLAAi iAlu 


TATTATCTGT 


CGATACGTTT 


1030 




GAAACGCTAT 


TTAAAGCAAT 


GAPTTPfSAAP 




ATGCCGTCTT 


TAACTTTTCT 


1140 




TTTGAAGAAG 


GCATTCAACA 


ATAPAAAPPA 

A X AUWtL V-A 


tta atp a aar 

1 lnnlunnnu 


1 lATTCAAGC 


AAGTTATAAC 


1200 


30 


TTCACTGACT 


ATTACATAGA 




araTrapaap 

AkjAl 1 AVjAAVj 


& & P* TV T^TV *TV* ^ TV 

AAGATATGCA 


CCAACCAAAT 


1260 




ATCATTCCTT 


ATCACAAAGG 


wX X X XAXV_\JX 


nrTTTr app a 

vj\- Ill LnuWi 


aa 11 ACACAC 


AACTACATTT 


1320 




AAATATCAGG 


CACAGTCACC 


APAAGATATP 

AV-AA*JA X A x v.. 


Al IuAXAVjI 1 


T 7A /"^ TV /**P» TV f~*f* TV 

I AtaAvJ viAC CA 


TCATCATTTG 


1380 


35 


rrrrrATTTG 


TTAGCGAAGG 


TTTAPTTAAA 


GP3TTATTTAT 
vjVj x X A X 1 1A1 


aPPTTP. A A AT 
AtLl lUAAAi 


TV T^*TV» TV TV TV 


1440 




CAGTCAATCG 


CCGAGATTAA 


ATAPTTPAflT 

A X X X WlVJ X 


TPTPATY^TAP 
iUl V— A X Vj X AVj 


A I iALLul 1 1 


CjAAAGGTATC 


1500 


40 


GCTTT CGAGT 


TGCTTGCGTA 


TGPATTP,PAA 

X UV^\ X X VJV^AA 


lAlV7^1 1 1 ITj 


A1AA1 1 1 l\iA 


TTA <T , T»TV X TV IV TV 

x Al 1 AGAAAA 


1560 


GTTTATTTTA AAATTCGTAA 


T AAAAAT AAT 

X A^AA^V\ X AA X 


nnnL x V_A x v_Vj 


aa pV^T'PTa & ~ 

AAUinl 1 1 AA 


TGGTCTAGGT 


1620 




TTCCATATCA ACTATGAGTA 


\_AX XAAAX XW 


AAATTPr"2AAT 
AAA1 X Lorvi 1 


papftTaappT 


TV TV TV TV ^ TV *T*/^ W TV 

AAAAGATCAA 


1680 


45 


ACAATCCCTG 


AATAAAACAC 


PAAPPAAATA 


PPPTAPAPTA 


LAlvATTAGC 


ATGTATTGTG 


1740 




GGTTTTTCTA 


CTTTTTGTAA 


ATATTGAAAA 


TTATAAGTAG 


TTGTTTTTTA 


ctattagggc 


1800 




AGAATGCTTT 


ACAATAACAT 


GCAAGTGTCA 


ATTAAGGGGA 


GCACTTGCAT 


AAATAGTATA 


1860 


50 


GGAGAGTGAG 


TAGTCTTGCA 


ATTTCTTGAT 


TTCTTAATCG 


CACTTTTACC 


TGCTTTATTC 


1920 




TGGGGAAGTG 


TCGTTCTTAT 


TAATGTGTTC 


GTCGGCGGTG 


GACCTTACAA 


ccaaattcgt 


1980 



55 
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TTCAATAATC CTACTGTAAT TATTGTCGGT CTTATTTCTG GTGCATTATG GGCGTTTGGA 2100 

CAAGCGAATC AGCTTAAATC TATTAGTTTA ATCGGTGTAT CAAATACTAT GCCAGTTTCT 2160 

ACAGGTATGC AATTAGTTGG TACAACATTA TTCAGCGTTA TCTTTTTAGG TGAATGGTCT 2220 

TCAATGACTC AAATTATCTT TGGTTTAATC GCCATGATAT TATTAGTTAC TGGTGTAGCA 2280 

CTTACTTCAC TTAAAGCTAA AAATGAACGT CAATCAGATA ATCCTGAATT TAAAAAAGCA 234 0 

ATGGGTATTT TAATTGTATC TACAGTTGGA TATGTAGGTT TCGTTGTACT TGGTGACATC 24 00 

TTTGGTGTTG GTGGAACTGA TGCATTGTTC TTCCAATCTG TCGGTATGGC AATTGGTGGC 24 60 

TTTATCCTAT CCATGAATCA TAAAACATCA CTTAAATCAA CAGCACTTAA TCTATTGcCA 2520 

GGTGTGATTT GGGGAATTGG TAACTTGTTC ATGTTCTATT CTCAACCAAA AGTTGGTGTA 25 80 

GCTACAAGTT TCT CATTATC ACAGTTACTT GTTATCGTTT CAACCTTAGG CGGTATTTTC 264 0 

ATTTTAGGAG AAAGAAAAGA TCGTCGTCAG ATGACGGGTA TTTGGGCAGG TATTATTATT 270 0 

ATCGTGATAG CTG CTATAAT TCTAGGTAAT TTGAAATAGA AAGTTAAATA CT CATGTAAC 2760 

GTAAAAATGT AATCACTTCT GAAAATAACC ATTCACTTAT AGAATGATTA AAATTAATTT 2 820 

25 TCGGGAATTT TACGTTGAAT GTTCCTCTAT ATGTCCTAGG AAATACGTGG CTCTAAAAAC 2880 

AAAACGCAAT AACACATCAT GACATTAATC ATGCGTTTTA AGACTTTAAA ATTAGCGATA 2 94 0 

CTTTTAAAAT CTTGATGATA TTCATATATC AAGTATGCGC CATACATATG AAGTGGATAG 3000 

30 CTGCATAACG CACTGCATTA TCAACTTGAA TGTATGAGTT GAACAACTAT GTCATAAATA 3 060 

AAAGCCCCCT TTTCACAATA TACATTTACA TATTGTGGTA AAGGGGGCTC TCATTTTCTA 3120 

CGAATACTAA AATGGATTTT ATTTTCAAAT GTGTAAACTA GACAAACACT GCCTGATACA 3180 

CGTACAAAAT AATGATACTA ATAATGATTG TCAAATTGGT CGTCATACCT ATAAATGGCA 324 0 

GTGTTCGATA TTTAAACTGA ATACCATAAG AAATAATTGC AACACcTACC GGGAACATCC 3300 

AAGTGACCAA CAATGTCGTC TTAATCATAT CATCTGATAC TGGTAACAAG ACATATACTA 3360 

ACAATCCCGC AACTAATGCT AATCCATAAT GCAAACATAA ATATTTAATA GTAGCAGGTA 3420 

TATACTTTCT TTCCAGAGTA AAATTCAACA TGACACCTAG CAAAATCATT GATAACGGCA 34 80 

TATTTGCATG GGAAAGTATG CTAAAGAAAT CGATTGCCAC ATGTGGTAAA TGGATGTGAC 3 54 0 

TTATATTCAA TATAAACATT ACAATGTATG TAACGAGTGG CACTGATTGT AATAATTTCT 3600 

TACCTAAATA TTTAAAATCG AATTGATCAC TACCTTCACT AAAGTAGCTA CCTACAAAGT 3 660 

50 AAGTAATTCC AAACATCACA AAGGCACCAC CTATATCAGC CATAACAAAA TAAATAAGTC 3720 

CCGTTTTAGG CCATATCACT TCAATTAGTG GATATGCAAA CAATCCAATA TTCATAGCAC 3 78 0 
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35 



40 



45 
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10 



15 



20 



25 



30 



35 



40 



CAATCATTTT 


CGCCACAATA 


C CAT ATATAA 


TCATTAAAAT TGGTAAAATG GAGAATGACA 


3900 


ATTTTAATTC 


TGCACTGTTT 


AAATTCACAA 


TAACTAAAGA TGGGAGTGTG ACATTAAGAA 


3960 


CTAATGTAGC AATGACTTGA 


CTATCTGTTG 


CTTTTATAAA 


ATTAATGCGC 


TTCAAAAAGT 


4020 


AACCAAGCGC 


AATTAATAAA 


ATAATCATAG 


TAAATTGTTC 


TGTCACTGTT ATCCCTTCTT 


4080 


TCAATAATCT 


TCATAATTTA 


TAACTTTAAC 


ATACTCCACA GATATTTTAG AAGTCTACTG 


4140 


TTTCATGCTA 


TAATCTACAT 


TAAATGCACT 


TAATTATATT 


TCAAAGGAGT 


GTTATAGTAT 


4200 


GTCTTTAGAA 


AACCAACTAG 


C CGAACTTAA 


ATATGATTAT 


GTTCGTCTTC 


AAGGTGACAT 


4260 


AGAAAAA CGG 


GAATCTTTGA 


ATTTAGATAC 


TTCCGCACTT 


GTTCGTCAAC 


TTAAAGATAT 


4320 


TGAAAATGAA 


ATTAGAAACG 


TTCGTGCT CA 


AATGCAAGAT 


TAATAATCTA 


TCATTCAAGC 


4380 


AATAAATGCT 


TTTTGTTACA 


TAAATTTGAC 

* ****** * * A V*** Vr 


TAGCATTGCT 


CTGAATACGT 


TATATTGATG 


4440 


AATTGCTTCA 


TTTTTCGCTC 


AATTAPHTPT 


AGAATCACAA 


GATGTTGTCG 


TGTTATGATT 


4500 


TAGTGTTTCA 


TTAACAACAT 


ACACGCATAT 


CTATCCCAAC 


ACTGCTATTT 


ATGTTTTCTA 


4560 


CGCTGnTGTA 


CTACATGAAC 


CCTTTGAAAC 


GGAGAGGAAG 


TTATCATATG 


CAATTTTAnC 


4620 


TGATTTTACT 


AGCAATACTT 


TAACnAATTG 


nTAGTTTAAT 


AGAATTTTA 




4669 


(2) INFORMATION FOR SEQ ID NO: 133: 









<i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2785 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



45 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 133: 

TTTGCACCCA TCTGaTACAA TGCACCATGC GGTTTAACAT GATTAATTTT AACTTGATGA 60 

ATGCGACAAA ACCCTTGTAA TGCACCTAAT TGATAAATCA TCAAATTATA AATCTCGTCG 120 

TTAGAGATAT CTATATTTCG TCTGCCAAAG CCTTTCAAAT CAGGTAAACC AGGATGTGCA 180 

CCTACTGCAA CATTATGTGC TTTGGCAAGT TTTACCGTTT CATTCATTAC ATTTTCATCA 240 

CCAGCGTGAA AACCACAAGC AACATTCGCA CTTGTAATTA ACGGAATAAT TTGATGATCA 300 

CCACCAAAGG AATAATTTCC AAATGCTTCG CCTAAATCAC AATTCAAATC AACTCGCATT 3 60 

ATAATTCCAC CCCTTTAACA ATTTGATGTT TTTCTAAAAA TTTAATATCA ACATCTTTTG 420 

SO CATCTCCATC ACGATATAGT GGATAATTTA AAA CTG CAT A TAAAAAATCG GCAGTTGTAG 480 

AAAATCCATC TATCACCATT TCATCTAAGG TGACTTTCAA CTTATCAATT GCTGAAGCTC 540 
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AACCGTGATA 


TAGTAAAGAA 


TCGACTCGCA 


CATTAAAGCC 


TTGAGGTAAA 


TGTAACGCTG 


SSO 




TCACTTTACC 


TGGTGTTGGT 


TGAAATTTCT 


TTTCaGGATT 


TTCGGCATTT 


ATTCTCGCTT 


720 


5 


CTATCACATG 


ACCATTAAAT 


TGAATATCGC 


TTTGTGAAAA 


AGGTAAATGA 


TTATGTTCCA 


780 




ATAAATACAG 


TTGTGCTGCA 


ACCAAATCAC 


GTTCTGCTCG 


CATCT CTGTA 


ACAGTATGTT 


840 


10 


CAACTTGTAT 


TCGAGCATTC 


ATTTCAATAA 


AGTAATGTGC 


GGTATCAGTT 


ACTAAAAATT 


900 


CAATCGTACC 


TGCACTTCTA 


TAATTTGCTG 


CACGTGCAAC 


TTTAACAGCA 


TCGTTACATA 


960 




TTTGTTGTCG 


TCTTTCTTCA 


GTTAATGCTG 


CACAAGGAGA 


TTCTTCGATT 


AATTTTTGAT 


1020 


15 


TTTTACGTTG 


TACAGAACAA 


TCACGTTCCC 


CTAAATGTAC 


ATAATTATCC 


TGCCCATCTC 


1080 


CCaTAACTTG 


AACTTCAACA 


TGTTTTGcAA 


CAGGTATAAA 


AG C CTCAACA 


TAAACACGAT 


1140 




CATCATCAAA 


gtattttttt 


CCTTCACTTT 


TAGCTTCTTT 


AAATGCCTTT 


TCTAAATCTT 


1200 


20 


CAGCTTTCTT 


TACAATACGT 


ATAC CTTTAC 


CACCACCGCC 


ACTGGCAGCT 


TTGATAACAA 


1260 




CTGGATAACC 


GATGTCTTTG 


GCAAGATTCT 


CAATTTCAGA 


CACATGATTC 


ACAGCACCAT 


1320 




TTGATCCTGG 


AATCACAGGA 


ACACCTGCAT 


GATGAACTGT 


TTGTCTTGCT 


GTTATTTTAT 


1380 


25 


CCCCCATCAT 


TTCCATCGTT 


TTTTTAGTAG 


GCCCTATAAA 


CGCTATGCCT 


TGTTCCTCAA 


1440 




CGGTTTGAGC 


AAATTTTGTT 


GATTCTGATA 


AAAAGCCATA 


TCCTGGGTGA 


ATTGCATTAG 


1500 




CACCAGTGAT 


TTGTGCAGCA 


GATATGATGC 


GGTCAATATT 


TAAATAACTA 


TCTAAAg CAT 


1560 


30 


TArcwTCCCC 


AATACATATA 


GCTTGATCTG 


CTAAATGTAC 


ATGCAAGCTT 


TGCTCGTCCC 


1620 




CTTTTGCATA 


AACTGCTACA 


GTTTCAATCC 


CAT ATT CTCT 


GCAAGCTCTT 


ATAATCCTTA 


1660 




CAGCAATTTC 


ACCTCTGTTC 


GCAATTAAAC 


AACGAAGCAT 


TTACTTACCC 


CCTTTACTTA 


1740 


35 


ATACGTACCA 


AAACTTGGTC 


GTATTCAACA 


TTTGTGCCAT 


GATCAGCTAC 


TATTTCAGTA 


1800 




ATrfCTCCAG 


CAACATCTGT 


TGTTACCTCG 


TTTAATACTT 


TCATCGCTTC 


AACATATCCT 


1860 


40 


ATAATATCTC 


CCTTGTTAAC 


TTTGTCACCG 


ACATTCACAA 


TTGGTTCAGT 


TAATTCTTTA 


1920 


CTATCTTGTA 


AAAAGAATGT 


ACCTATCATT 


GGTGATTTAA 


TGTCATGATA 


ATCATTTGTC 


1980 




GAAACATCGG 


AGTTATCATT 


CGCTTTTGAA 


GCTGTCAAAT 


CATTATTGTT 


CATACTTTGA 


2040 


45 


TTTGATTGAT 


TACTGTGTGC 


AGCCAAATGA 


TTCGAGTCAG 


TGAAGTCAAT 


TTCTATTTCA 


2100 




TCTTCAAAAT 
TGTTCGATTT 


TTTTATATTT 
nTTCAATATT 


AAATTTCTTA 
CATTTTACAA 


ACATCATTTT 


CCTTCACTAA 


TTTGATTATT 


2160 




ATCCCCTTTT 


AAAATTGTTG 


ctaatttttt 


2220 


50 


CGAAGTATGT 


CGCAAGCTAG 


ATGTATCAAA 


AATTGGAGTC 


TTTTGATGAC 


TCTTAAGAAT 


2280 




TTCATTAAAC 


AGAGACATTT 


GTTCCCGATT 


CTTATCTACA 


GCTTCTTGGA 


ATGATATCCA 


2340 
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TACAGTTGCA 


ATTTTGGTAT 


AACCACCTAT 


CGTTTGTTTA 


TCATTAAGCA 


GAATAATAGG 


2460 




TTGACCATCA 


TTTGGTACCT 


GAACACTACC 


AAGAGCAACC 


GGTTCAGAAA 


TGATATCTGC 


2520 


5 


TTGATTAAtT 


GGTGCAACGC 


TGTCACCTTC 


CAAACGATAG 


CCCATACGGT 


CTGATTGTTC 


2580 




AG TAATT AAA 


TATGGATGAT 


TTACAATTTT 


CGCTCTAGCC 


TCTTCAGAAA 


ATGCCTCGAA 


2640 


10 


TTGAGGTCCT 


TGAAGAATGT 


GTATAATATT 


ATTTTCTGGC 


AATAAATCGT 


CCTGTAAATG 


2700 


AATCGTCTTT 
AG CTAATAAC 


CCAATGTTTT 
TTTCTACCTT 


CTTTAAAGTC 
TGAAT 


ATTATTTATT 


TTCACTGTTA 


TTACATCATC 


2760 
2785 


15 


<2) INFORMATION FOR SEQ ID NO: 134: 








20 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1010 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 










(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 134: 






25 


AATGGAAACG 


GTTGAAACAG 


CAATTATTAC 


TATTTCTATG 


GGTGAAGGTA 
• 


TTTCAGAGAT 


60 




ATTTAAATCA 


ATGGGTGCCA 


CACATATCAT 


TAGTGGTGGA 


CAAACGATGA 


ATCCTTCTAC 


120 




AGAAGATATC 


GTTAAAGTCA 


TTGAACAATC 


AAAATGTAAA 


CGTGCAATTA 


TTTTACCGAA 


160 


30 


TAATAAAAAT 


ATCTTAATGG 


CAAGTGAACA 


AGCAGCGAGT 


ATTGTTGATG 


CAGAAGCTGT 


240 




TGTTATTCCA 


ACGAAATCTA 


TTCCTCAAGG 


TATAAGCGCA 


CTATTCCAAT 


ATGATGTGGA 


300 




CGCAACACTT 


GAAGaAAATA 


AAGCGCAAAT 


GGCTGATTCA 


GTAAATAACG 


TTAAATCTGG 


360 


35 


TTCATTAACG 


TACGCTGTTC 


GTGATACGAA 


AATTGATGGC 


GTTGAGATTA 


AAAAAGACGC 


420 




GTTTATGGGC 


TTGATTGAAG 


ATAAGATTGT 


AAGCAGCCAA 


AGTGATCAAT 


TAACAACGGT 


480 


40 




TACTGAGTTG 


TTAAATGAGA 


TGTTAGCAGA 


AGATAGTGAA 


ATATTGACTG 


TGATTATTGG 


540 


TCAAGATGCA 


GAGCAAGCAG 


TTACAGATAA- 


CATGATAAAC* 


TGGATCGAAG 


" AGCAATATCC ~ 


600 




AGATGTAGAA 


GTGGAAGTTC 


ATGAAGGTGG 


ACAACCAATT 


TATCAATATT 


TcrrrrcAGT 


660 


45 


AGAATAAAAA 


TTTAAAATAA 


AAAACTACCA 


ATGATAAATC 


ATCAGTTGGT 


AGTTTTTTAT 


720 




TTTGCTATTT 


TAGTGATATT 


GCGGGTTAAA 


AGTATCGTTC 


TCGAGTTGCT 


AACAATGTCA 


780 




TGTTCAACTT 


AGTCATGATA 


AAATAAATAA 


CATACTAAAT 


GATACGTAAA 


ATCAAATAAA 


840 


SO 


ACATAGGTGA 


TTTATTTTGG 


CTAAAGTAAA 


CTTAATAGAA 


AGTCCATATT 


CTCTTTTACA 


900 




ATTAAAAGGT 


ATAGGTCCTA 


AGAAAATAGA 


AGTATTGCAA 


CAACTAAATA 


TTCATACAGT 


960 



720 
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(2) INFORMATION FOR SEQ ID NO: 135: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1540 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 135: 





TGTAGTTGAA 


CATGAACAAC 


AAAAGAAAGA 


AAAGACAAAA 


AAGCAATACA 


AGCCATTTTG 


60 


15 


GATTGTCATG 


AGTTTTATAA 


TACTTATAGT 


TGTACTATTA 


CTCCCGGCAC 


CTTCAAGTCT 


120 




GCCGATAATG 


GCTAAGGCAG 


TACTAGCTAT 


TTwAGCTTTT 


G CAGTT ATT A 


TGTGGGTAAC 


180 




GGAAGCTGTA 


TCATATCCGG 


TGTCAGCAAC 


TTTAATTATT 


GGCTTAATGA 


TATTACTTTT 


240 


20 


AGGATTTAGC 


CCTGTTCAAA 


ATTTAGGGGA 


GAAGCTAGGT 


AATCCGAAAA 


GTGGCAGTGC 


300 




T ATTTT AG CT 


GGAAGTGACC 


TTCTAGGAAC 


TAATCATGCA 


TTATCATTAG 


CGTTTAGTGG 


360 




ATTTGCAACT 


TCAGCTGTAG 


CTCTCGTTGC 


AGCTGCATTA 


TTTTTGGCTG 


CTGCTATGCA 


420 


25 


AGAAACGAAT 


TTGCATAAAA 


GACTAGCTCT 


TTTAGTGTTA 


• 

TCAATTGTTG 


GTAATAAAAC 


480 




TAGAAATATA 


GTTATTGGAG 


CAATTATCGT 


TTCAATTGTA 


CTTGCATTTT 


TCGTTC CTTC 


540 




TGCAACAGCT 


AGAGCAGGGG 


CAGTTGTACC 


AATCTTGCTG 


GGTATGATTG 


CGGCATTTAA 


600 


30 


AGTTTCCAAA 


GATAGCAAGT 


TAGCGTCTTT 


ATTAATAATT 


ACTTCAGTAC 


AAGCTGTGTC 


660 




AATTTGGAAT 


ATTGGTATCA 


AAACGGCGGC 


AGCACAAAAT 


ATCGTAGCGA 


TTAATTTTAT 


720 




AAACCATCAA 


TTAGGATTTG 


ATGTTTCATG 


GGGCGAGTGG 


TTCTTATATG 


CAGCG CCTTG 


780 


35 


GTCCATAGTT 


ATGTCCGTAG 


CTTTATATTT 


CATCATGATT 


AAAGTGATGC 


CTCCAGAAAT 


840 




TAAT&CAATA 


GAAGGTGGTA 


AAGATTTAAT 


AAAAGAAGAA 


TTGCATAAAC 


TTGGCCCCGT 


900 


40 


TAGCCCACGT 


GAATGGCGTT 


TAATTGTTAT 


ATCGATGTTA 


TTATTACTGT 


TTTGGTCAAC 


960 


TGAAAAAGTA 


TTACATCCGA 


TTGACTCTGC 


ATCCATTACT 


ATTATTGCTT 


TAGGTGTTAT 


1020 




GTTAATGCCG 


AAAATTGGTG 


TCATGACATG 


GAAACATGTT 


GAAAATAAAA 


TACCATGGGG 


1080 


45 


AACAATTATC 


GTGTTTGGTG 


TAGGTATTTC 


ACTAGGTAAC 


GTTCTTTTGA 


AAACAGGTGC 


1140 




AGCTCAATGG 


TTAAGTGATC 


AAACTTTTGG 


TGTTTTAGGT 


TTAAAACATT 


TACCTATTAT 


1200 




CGCGACAATT 


GCACTTATCA 


CGC1TTTTAA 


TATATTGATT 


CATTTGGGCT 


TTGCGAGTGC 


1260 


50 


AACAAGTTTA 


TCATCAGCGT 


TAATACCTGT 


TTTTATTTCG 


CTAACCTCTA 


CGTTACACTT 


1320 




AGGAGACCAG 


TCTATAGGAT 


TTGTTTTAAT 


TCAACAATTT 


GTTATTAGTT 


TTGGTTTCTT 


1380 
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AGATTTCTTG AAGGCAGGTA TACCATTGAC AATTGTAGGG aATAt C t AgT GaTAGTTTTT 15oo 
AGCATGACTT ATTGGAAATG GGTAAGGTTG CnTTAATTAA 
(2) INFORMATION FOR SEQ ID NO: 136: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11823 base pairs 

(B) TYPE: nucleic acid 
10 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



1540 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 136: 

ACTTCTCACA ATAAGAAATA TGAAATTGTT ATGTGTTAGT TGAGATTCAG TGATGAATTA 60 

CTTTTATCAT TTAAAATGTT GTTATCATTG TCATGCGTTA CCAAATCGCT TACGTATACA 120 

CGATTCCCAA TCTTAACATA GACGATTTGT ATATCAGAAT TTTCTGATTA CTAACAGTTT 180 

ACCTAAGTTT AAATATCTGT TCAATGATTT TCAGTTATTT TTAAAAGAAA AATCGTAATG 24 0 

CTGCCATGAT AACAATCCCA CTAATAATTG TAATAGTTAA At ACGCGTGA TTATAGATAA 300. 

2S AATAACCGTC GGAATGAGCG CGATAATGTA AGGGATGTTT AATGTATACC CCTCACCATG 3 60 

AGGCGTCTGT TGAATAATGC TGTCAATGAC AAGTGCCGTA AATAGTGTGA TTGGGATAAA 4 20 

TGATAGCCAT CGAAC CACGA CATCAGGCAA TTGCACTTTT GAAATCATGA TAAAAGGTAT 4 80 

30 AATTCGAATT AATAG CGTTA CGATACCACA CAATAAAATA AGTATTAACA TGTTCATATG 54 0 

AGTTATCATT GTTCCATCAT CACTCCTAAC GCTGCTGAAA TTGTGGCTGC AATTAATATT 600 

GCTAGATATG AAGGCATAAA CATACTTAGC GATAACATCA TTACTATGAC GGCAATAATG 660 

AGTACTATGT AAATTCTTAA TCGCGATTTA GTAATTGATT CAAATTGCGC AATGGCCAAA 720 

AAGATAAACA TAGCCGTGAT AGCAAAATCT AAC CCTAGCG TTTGCGGATT TGAGATATAT 780 

TCGCCAAATA AAGCCCCAGC TACACATGAA ATTGCCCAAA ATAAATATGC TGTGATGTTA 84 0 

"AGACCATGCA TCCAACGATC ATOCD^TAGCT TCT^CTTTTA ^^TAAGGTCST AATGGCGACG 900 

CCAAACGTTT CGTCAGTTAC TAATGAACCT AATCCAACAC GGTTCCAAAA CCCATATGTC 960 

TTGAAGTTTG GTGCAAGCGA CATACTTAAA AGGAACATTC TTGAATTTAC GATAAATACA 1020 

GTTAGTACAA TCGCTGATAT AGGTGTACCT GCTATAAACA ACGCGCACAT AATAAATTGC 1080 

GCAgcaCCGG CATATATAAC AAGACATAAC AAGACAATTT CTAAAATACT AAAGTTTTGA 1140 

50 GACGAAGCCA CAATACCAAA TGAAATACCA ACACCGGCAT AACCCAATAA TGTTGGGATA 1200 

CACTCTTGCA CGCCTTGTCT AAAACTTAAA TGTGTTGTCA TCTCAATTAC CTCCTTTGCC 1260 
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TAAGCAATAA CATTAGACAT CAGTTTGTCT GAGGTTAGAC ATTCCGGAGT CTTTAGTCAG 1390 

CTT CAT ATT A ACTTTTTATX TTTGAGAATT TTCAATTTTT TATTTAAGAC TACCTCCATA 144 0 

TTTTCTATGG aTTTGTAGTT GTTTTTAAGT ATCAATTTTA TAAATTTTTA TATCTGATGA 1500 

TGAGTCTGGG aTATTGaTTC ATGTACCACT CCCTTaTaAT CATCCCCTCC CCCTaCCCTA 1560 

CTCCATCGAT ATAACTCATA CTACATATCA ACGAAATCAG TATTTTATCG CTTCCTTTCC 1620 

TATATTAGTG ATGCTCAAAC TTGTTACGTT TTAGATTGTT TTAGTTCATC ATAATTATCC 1680 

CGTATTGTTG CTATAATGAA ATGCGTTCAC CCCATTAAAC CACAAACTTA ATTTATTGTT 174 0 

GTTATGTGCA TTGGCTCACT ATTATATTTT TACAGCACAA AAAAAGTGGC GACAGTTCGT 1800 

CACCACTTTT TAAAATATTA TTTAAAGTAT CTTGCCCTTG CTTTAAGTAT ACGTAGATAT 1860 

ATACTTTTTA AAGCTTGTAG CTAAAGCCTT TATTTAACTG GTTTTGAAAT TTGTGTTTTA 1920 

CCACCCATAA ATGGTACTAA TGCTTCTGGA ATTGTTACTG TTCCATCTTC ATTTTGGTAA 1980 

TTTTCAACAA TAGCAGCAAA TGTACGTCCA ACTGCTAAAC CACTACCATT TAATGTATGT 204 0 

GCTAATTCTG GTTTAGCTGC TTTGTCACGC TTGAAGCGGA TGTTAGCACG ACGCGCTTGG 2100 

AAATCCGTAC AGTTTGAGCA TGAACTAATT TCTTTATAAT CATTGTAGCT TGGTAACCAA 2160 

ACTTCTAAAT CATATGTTTT GCTTG CACTA AATCCAATAT CACCTGTACA TAAAATAACA 2220 

CGACGGTATG GTAAACCTAA CTCTTCTAGA ATTGCTTCTG CGTTTGTTGT CATTTCTTCT 228 0 

30 AAAGCATTCC ATGAATCTTC AGGTTGTTCA AAACGTACCA TTTCCACTTT ATCGAATTGA 234 0 

TGTAAACGAA TTAATCCTCT TGTATCTCTA CCTGCTGATC CTGCTTCACT ACGGAAACAT 24 00 

GCAGATTGAC CAGTGAATTT TTCAGGAAGT ACACCTGGTT GAATAATTTC ATTACGGTAG 24 60 

55 AAATTCGTTA ATGGTACTTC AGCAGTTGGA ATTGTATATA ATCCTTCTTT TTCTACTTTA 2520 

AAT^ATCTT CTTCAAATTT AGGTAATTGA CCTGTACCAT ACATTGTATC TGCGTTCACA 2580 

AGCTGTGGTA CCATCATTTC TGTATAACCA TGTTGTGTTG TATGTTTTGT AATCATATAG 264 0 

TTCATTAAAG CACGCTCTAA TTGCGCACCT TCATTTGTTA AATATACAAA ACGCGCACCT 2700 

GAAACTTTTG CTGCACGATC AAAATCAGCC ATTTTCAATT CTTCTACAAT ATCCCAATGT 2760 

GCTTTGGGTT CAAATGAAAA CTCaCGTGGT GTACCCCACT TTTTAACTTC AACGTTATCT 2820 

T CATCAG ATT CACCTTGAGG TACATCATCA CTTATTAAAT TTGGAATACG ACAAAGGATA 2880 

CCTGTCATTT TATTATCAAT TTCATTTAAT TGACTATCTT TTTCTTTAAT ATCGTCACCT 2 94 0 

AATGTGCGCA TTTCAGCAAT CACATCATCA GCATTTTCTT TATTACGTTT TTTTAATGCG 3000 

ATTTCTTCGC TTACTTTATT ACGACGTGCT TTCATTTCTT CTGTTGCACT AATTAATTTA 3 06 0 
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TCAATTTTGC TCTTAACTGT GTCAGGCTCA TTTCTGAATA ATCTAATGTC TAACATTAAC 31B0 

CTTCATCCTT TCCCAAATAA TTATCATTTA TTATGOAATG ACGTACGTCT TTATTTTTTA 3240 

GAAAATAAAA AAAGACCACA TCCCTACAAG GGACGTGGTC TACGCGTTGC CACCCTATTT 3300 

AACAATTTAA GTTATAAAGA TACACTAAAC CTAAATTGCA CTTCACTAAA ATAACGGTTA 3360 

TCACCGATTG TTCTTTTAAA TTAAGTAGGT AGATTCATAT ATATGTTGAT TCTTGTTCAC 3420 

ACTAACCACA AGCTCTCTGA TATCGAACAC TATATATTAC TTGTCCTACG AACAATGTCT 34 80 

TATTAAGTTA TTTTTAATAT AGCAAACTAT ATTTGCTTTT TCAAGTAACG ATTTCAAACA 354 0 

TCACTCATGT CGATTTAGTG ACATGCAGTC GTTTGATAAA TTGATTGCTT TAAATACTGT 3600 

GCAACCGCTT CAATATCTTT ATGAAATTGA CGATCATGTG TAATGGATGG CACGATACTT 3660 

CGAAACT CAT CATACTTGCG ACGTGTTTTT GGTGATAATC CTTCAACACC TTTTAACTCT 3720 

GCTGCTTGTA ATGCAATAAC ACATTCGATT GCCAGCACAC GTCTTGCATT TTCAATAATT 3780 

TGATAAC CAT GTCTAGCAGC TGTAGTTCCC ATAGATACGT GATCTTCTTG GTTCGCAGAT 384 0 

GAAGTGATAG AATCAACACT CGCTGGATGC GCTAAAGTTT TATTTTCAGA AACGAGACTT 3900 

25 GCAGCAGCAT ATTG CAT AAT CATCGCGCCA CTTTGCAATC CTGGCTCTGG ACTAAGAAAT 3960 

GCTGGTAAAT CACCATTTAA TTGAGGATTT ACTAGTCGCT CTAGACGACG TTCCGATACG 402 0 

TTTGCTAATT CACTTACACC TAATTTAAGA TGATCTAATG CAAAAGCAAT AGGTTGTCCA 4 08 0 

30 TGGAAGTTAC CACCTGAAAT AACAAACGTT TCATTTGCTT CCTCAAATAT AAGTGGATTA 4140 

TCATTAG CCG CATTCATTTC AAATTCTAAT TGCTGTTTAA CATAATTGAA TACTTGAAAA 4200 

CTCGCGCCAT GGATTTGTGG TATACAACGC AACGTATATG CATCTTGTAC ACGTATTTCT 4260 

35 

GATTGTCGCG TCGTTAATGT TGATCCTTCT AACCAATCAC GCATACGCGC TGCCACATTA 4320 

ATCTQTTCTT GAAAATTACG AACTGCGTGC ACATCATGTC GATATGCATC TATAATGCCA 4 380 

TTAAGAGACT GATGCGTTAA TGCAGCAATC CATTCAGATT GGTAACCTAA ATCTTCTGCT 444 0 

40 

TCTATATAAC 4 500 

CCTTCTTTAG CCTGAAGGTT CAAAGGTTGT CTATTTAATT CTCTTAATAC ATCGTCACTA 4560 

TCCTTTTCTT CCCCTCTGTA CAATACTTTC CCTTCACCAA TTAATGCTAA TGCTAAATGT 462 0 

45 

GATAATGGCG CTAAATCTCC TGATGCACCG AGAGAGCCTT GCTGTGGGAT TATCGGTATA 468 0 

ATACGTTCAT TTATAAAAAA TTGTAATTGT CTCACTAATT CTAAAGTGGC ACCTGAATGA 4 74 0 

50 CCTTTTAATA ATGTATTCAA TCGTAAAATC AT CATGACTA ATGCTACTTC TTTTGAAAAT 4 800 

GGCTCACCTA GTCCACAGGC ATGTGAGCGT ATCAGATTCA CTTGTAATTC ATTATATTGC 4 860 
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TCCT CATTTT CAATAATACG TTCAACTACC GCTCTACTTT TTTTGACACG TTCTAACGCA 
TCATCAATAA TTTCAATCTT TGATTGTTGT TGTAAAAATG ATTTAATATC CTCAATTGTT 

AGTGTTTCAC CATCTAAATA TAAAGTCATA TATGTTACCC CCTTGTTTAT ATTAAGTAAC 5100 

CCATCCTTCT TGAAGTATAC GTTTTCATTT TTATTGAAAC AATGGTTTTA CGTACATTTA 5160 

TAACCTATTA TCAGAGCACT ATTGTAGTGC GTTAAAGGAT ATTAAGATTG TTGTAAG CAT 5220 

ATTTAATAAT TTATCTATTG ACGAATTGCA TATACAGGTA TAGTATTTTC TATTGTATTT 52 80 

AACGACAAAT AATAATGAAT TCAGAAATTT ATAATACATT TTGTTAAAAG TTACTATATA 534 0 

TTTTTAAAAT TGAATAAATT CGGAAAAGGC TTTTACATGG GAGGTTATAT CACTATGGAA 54 00 

ACGTTAAATT CTATTAACAT TCCTAAGCGT AAAGAAGATT CACATAAAGG TGATTATGGC 54 60 

AAAATTTTAT TAATTGGTGG ATCTGCTAAC TTAGGTGGTG CCATTATGTT AGCGGCTCGT 5520 

GCATGTGTAT TTAGCGGTAG TGGTTTAATC ACTGTAGCTA CACATCCAAC AAATCATTCA 55 80 

GCATTACATT CTCGTTGCCC AGAAGCGATG GTTATTGATA TTAATGATAC GAAAATGTTG 564 0 

ACGAAAATGA TTGAAATGAC TGACAGTATA CTAATTGGTC CAGGTCTTGG CGTTGATTTC 5700 

25 AAAGGAAATA ATGCCATTAC ATTCCTACTA CAAAATATAC AACCGCATCA AAATTTAATC 5760 

GTAGACGGCG ATGCGATTAC AATCTTTAGT AAACTGAAAC CGCAATTACC TACATGTCGT 5820 

GTGATCTTTA CACCACACCT CAAAGAATGG GAACGATTAA GTGGTATTCC TATTGAGGAA 58 80 

30 CAGACATATG AGCGTAATCG TGAAGCAGTT GAT CGTTTAG GTGCAACTGT TGTACTTAAA 5940 

AAACATGGTA CTGAAATTTT CTTTAAAGAT GAAGACTTTA AATTGACAAT CGGTAGCCCA 6000 

GCAATGGCGA CTGGTGGTAT GGGCGATACA CTTGCTGGTA TGATTACAAG CTTTGTCGGT 6060 

CAATTTGATA ACTTAAAAGA AG CGGTTATG AGTGCCACAT ATACACATAG TTTTATTGGC 6120 

GAAASCCTTG CAAAAGATAT GTATGTGGTG CCACCATCAA GACTTATCAA TGAAATACCT 6180 

TACGCAATGA AACAATTAGA AAGTTAGTCA TTACTAATCA TTGAATATAG TAAAGCATTA 6240 

CTTTCTAGCA TAAAAATAAG ACTCCCCTAC ATATAGGGAA GTCTTATTTT TTATTATTCT 63 00 

TCATCTGATG ATTGTTGTAT ATCTTCTTCA ACACGATCCA TGAAATCTTG TCTTACTTGA 63 60 

ATACGTC CAT CTTCATCATT TTCTTCTGAA TCAATCACTT CAGTATGAAT TGCATTTCCT 64 20 

GGTGTTTCAT CATTTaCAAC CGCTTCACGT TGTTGTTCAG TAC CATCTTC AGATACAGTT 64 80 

GAAGTAGATT GCTCATCTTC ATTCGTTTCA TCTTCTGCAT CTTCTTTTAC TTTAGCAACC 654 0 

GTTGAAACAA ATTGATCATC ACCTAAGCGA ATTAAGCGAA CACCTTGTGC TGCACGACCA 6600 

TTTTGAGAAA TATCTGCAAC ATCTAGTCGA ATAATGACAC CTGCATTAGT AACAATCATT 66 60 
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GTAGCTGTTT TAATACCTTT 
CGTTT AC CAT AACCATTTTC 
ACATCAAGCC CTACAACTTC 
GTACGGCCTA AAGGACGTAA 
CCAATCAAGA TATCTTCTTG 
CTGAACGAAA TCGCAATCTT 
CGTTTAACGA CACCACGTTT 
TTAACAGCAA TCATTGTACT 
GGAATACCTT TAGACTGTCT 
CGACCTTTGT TAGTAAAGAA 
ACAAAATCTT CTTCCAATGT 
CGATATGTAG ATACCGGCAA 
TGTTCTTCTG GAATTAAGTC 
GTACGACGAT CATCACCGAA 
AATAACACTT CTTCATCAGC 
TTATATTCAG CTTCAATTTT 
AAAATAGCTT GAGCTTGTTT 
ACTTTATCTG TATCTGACTC 
ATACGTAATC CTTCTAAAAT 
CGTCTTCTAA CAACTGTCTT 
ATAAGCTTCG GTCTACCATT 
GGTGTTTGTT TGTATAAGTT 
ATAACG ACAC" GC^CACCAGT 
ATTTTCTTGT CACGAAOGAG 
AAAGGAATTT CAGTGACAAC 
CGAGAACGCA TTTGAATTGA 
CCTAAAATAA GTCCAGCAGT 
ATTGAAATAT CAGGGTTCTT 
TGTGGTGGAA TATTCGTTGC 



ACCACCACGA 
AGTAACTACT 
GTCACCTTCA 
TGTTGATTCA 
ACCACTTGTT 
ACCATTTCTA 
AGTTGCAAAC 
AATGACTTCA 
TGATAACTCA 
CAATACATGG 
ATTCATACCT 
ACGTTTAATG 
TTCGTCCTCT 
ACGATCTCTA 
TAAGATTGCT 
GTCTCTCTCT 
TTCAGAAAGT 
ACGAATCGTT 
GTGGGCACGA 
TTGATGCTCT 
TACAAGTGCA 
ATTTAAAATG 
ACGTAAACTT 
CTCTGCAATT 
AATACGTTGA 
ACCACGACCT 
TGGGAAATCA 
ACTTAAGCTA 
CATACCTACC 



TTTGATAAGC 
AATACTTCAT 
CGAAGTGTAA 
GGGAATCGAA 
AAGCGAACTG 
TTTATTCTTG 
ACTAAGAAGT 
TCATTTTCAA 
GGCACTTCGT 
TCATGTGTAC 
TGAACACCAC 
TAGTTATTAT 
AAGTCTTCAA 
ATTTCAGTCA 
TCTAATTCAC 
AAACCTGTTA 
TTGAAGCGTT 
GAAATAATTT 
TCTTTAGCTT 
AAATAATGTA 
ATCATATTCA 
ACACTAGCAT 
GTTTC^TCAC 
TTTTCAATCA 
CGTCCGCCTC 
GTTTCATATG 
GGACCTTCAA 
AGTACACCAT 
GCGATACCTG 



GATAGTCATT 
CAACACTGTT 
TACCTTTCAC 
TTAATGATGC 
CAATTAACTC 
AGAAGTTACT 
TGTCTTCACT 
GTTCAATAGC 
AACCTTTAAG 
TTAAAGTTAC 
GACCACCACG 
GGCTTAGTGT 
ATCCACCTAA 
ATTCATCTCT 
TAATATAATT 
GACGTCTTAA 
GTTGCAAGCT 
CATCGATATG 
TACGTAAgTT 
CCAACGCTTC 
CACCAAATGA 
TTGCATCCTT 
GTAAATCAGT 
TACGAGCCTT 
CACGTTCTTC 
CACGTCTAAT 
TATCCTCCAT 
TGATTAATTC 
ATGCACCATT 



AACTGGCGTA 
TGCATGAGCT 
ACCCGTTGCT 
ATGTGATGTA 
ATCATCTTCT 
TAATGCTGAA 
TTCAAGGTCT 
ATTCACTACA 
TTTGTATACA 
CAATTGACTG 

AATTACTATT 
TTGAATTTCT 
AACTAACTGT 
TAATAACTCA 
ACGCATGTCT 
TTCCATTGCA 
GTCAAGTGCG 
GTATTGCGTA 
TTTTAAATTA 
TGTTTGAAGA 
ACGCACATCA 



GATACCGTCA 
ATTCACTTGG 
AATAACTGCA 
ACCACTCTTA 
TAACTCAGCA 
TGTTAAGTTA 
GGCTAATAAG 



6780 

6840 

6900 

6960 

7020 

7080 

7140 

7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 
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AAATCTATTG TATCTTTATT AATATCACGT AACAGTTCAA GTGTGATTTT AGTCATACGC 8560 

GCTTCAGTAT AACGCATTGC TGCTGCGCCA TCTCCATCCA TTGAACCAAA GTTACCTTGG 864 0 

CCATCAACAA GCGGATAACG ATAACTGAAA TCTTGAGCCA TACGTACCAT TGCTTCATAA 8700 

ATAGATGAGT CACCATGAGG GTGATATTTA CCCATTACGT CACCAACGAT ACGTGCTGAT 876 0 

TTTTTATATG ATTTATCCGG TGTCATACCT TGTTCATTTA ATCCATATAG TATACGACGA 8820 

TGTACTGGTT TTAAACCGTC ACGAACATCT GGCAATGCAC GAGCAACGAT AACACTCATC 888 0 

GCATAATCTA AAAATGATTC ACGCATTTCA CTGGTAATAT TTCGTT CATT TATTCTTGAT 894 0 

TGAGGTAATT CAGCCATCAA GAGTTCCTCC TTCAAAAGTT CAGTTCACAG CGCTTAGAAG 9000 

TCTAAGTTTG CATAAACTGC ATTATCTTCT ATAAATTGTC TACGGTTTTC TACAACGTCA 9060 

CCCATTAACA TTTCAAATGT TTGGTCCGCT TCAATCGCAT CTTCAAGTTT TACTTGTAAA 9120 

AGAGCGCGGT GCTCAGGGTT CATTGTTGTT TCCCAtAATT GATCTG CATT CATTTCTCCA 9180 

AGACCTTTGT ATCGTGCAAT AGACCATTTT GGTGTTGGAT TCAATTCAGA TTTAAGTTTA 924 0 

TCAAGTTCCC TATCATTGTA TACATAATAC TTTTGTTTAC CTTGTGTCAG TTTATACAAC 9300 

GGTGGCTGTG CAATATACAC ATAGCCTGCT TCAATTAACG GTCTCATAAA TCGATAGAAG 9360 

AATGTTAATA ACAATGTTCT AATATG CGCT CCATCCACAT CGGCATCAGT CATAATGACG 9420 

ATTTTGTGAT ATCTTGCTTT CGCTAGATCA AAGTCGCCAC CGATTCCTGT ACCAAATGCT 94 80 

30 GTGATCATTT GACGAATTTC ATTGTTATTC AAAATTCTAT CTAATCGTGC TTTTTCAACA 954 0 

TTTAATATCT TACCTCGTAA TGGTAAAATC GCCTGCGTTC TAGAGTCACG ACCAGATTTT 96 00 

GTAGACCCCC CGGCAGAGTC CCCTTCGACT AAGAAAATCT CACATTCTTC AGGACTTTTA 9660 

35 CTAGAGCAAT CGGCTAATTT ACCTGGAAGG CTTGCTACAT CTAACGCTGA TTTACGACGT 9720 

GTTACTTCAC GCGCTTTTTT CGCAGCAACA CGTGCACGTG CCGCCATAAT ACCTTTTTCA 9780 

ACCACTGTAC GTGCGACTTG TGGATTTTCA TATAAAAATC GTTCAAAGTG CTCTGAGAAT 984 0 

AATTTATCTA CAACTTGACG CACTTCAGAA TTACCTAATT TTGTCTTCGT TTGACCTTCG 9900 

AATTGAGGAT CACCATGTTT GATAGATATA ATTGCTGTCA T AC CTTCACG TGTATCTTCA 9960 

CCAGAAAGTC TATCTTTTTC TTCTTTCATA ATCTTGCTAC TTAAACCATA ACTATTTAAG 10020 

ACACGCGTTA ATGCAC G TTT GAATCCGTCT TCATGCGTAC CACCTTCATA CGTATGAATG 1008 0 

TTATTTGCGT AAGTTAAAAG ATTTGTGGCA TATCCTGAGT TATATTGAAT CGCAATTTCT 1014 0 

ACTTCAATAT CATCTTTAGA TTGATGAATA TAAATTGGCT CATCATGAAT AGGTTCTTTA 10200 

TTTTCGTTCA ATAACTCAAC GTACGATTTA ATACCGCCCT CATAGTGATA GGAGTCTTCT 10260 
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GCAAGCTCTC 


' TAATACGCTG 


CTGTAATGTT 


TCATAGTTGT 


ATACAGTTGT 


1 CTCTGTGAAG 


10380 




ATTTCTCCAT 


CTGCTTTAAA 


ACGAAtGaCA 


GTACCTGTCT 


TAtCAGTnGT 


GCCAACTTCT 


10440 


s 


TTTAAGTCAA ATTGAGGTAC 


ACCTTTTTTA 


TATGCTTGAT 


GATATATAGT 


CTCATTTCTG 


10500 




TGTACATATA 


CTTCTAAGTC 


TTGTGACAAT 


GCGTTTACAA 


CTGATGAACC 


AACACCATGT 


10560 


10 


AAACCACCAG 


ATACTTTGTA 


TCCGCCACCG 


CCAAATTTAC 


CACCAGCATG 


TAAAACAGTT 


10620 




AAAATAACTT 


CGACAGCTGG 


ACGTCCCATT 


TTTTCTTGAA 


TATCAACTGG 


GATACCACGT 


10680 




CCGTTATCCG 


TTACTTTAAT 


CCAGTTATCT 


TTTTCAATAA 


CAACTTCAAT 


TTGATTTGCA 


10740 


15 


TAACCaGCTA 


ATGCTTCATC 


GATACTATTA 


TCGACAATTT 


CCCACACTAA 


ATGGTGCAAA 


10800 




CCTCTCTCTG 


AAGTCGATCC 


TATATACATA 


CCTGGTCTTT 


TACGTACTGC 


TTCTAAACCT 


10860 




TCTAATACTT 


GTATTTGCCC 


AGCACCATAA 


TTATCCGTGT 


TGTTTACATC 


TGACAATGCA 


10920 


20 


GTCACCATCG 


CTTTCTGTTA 


CTTTATAATT 


TCACCTTGAT 


TAATACGATA 


CAATTTAGCG 


10980 




TTATTCATGA 


TTTCATGATC 


AATACCATCT 


ACAGATGTCG 


TAGTGACAAA 


TGTTTGTACT 


11040 




TTATGCTGAA 


TCGTACTTAA 


TAAATGCGTT 


TGACGCGAAT 


CATCTAATTC 


ACTGAGTACA 


11100 


25 


TCGTCTAATA ATAAGATGGG 


ATATTCCCCA 


ACTTCGATAT 


TCATTAACTC 


AATTTCAGCT 


11160 




AATTTAATGG 


ACAAAGCCGT 


TGTACGTTGC 


TGTCCTTGAG 


AACCATATGT 


TTGAGCATCC 


11220 




ATGCCATTCA 


CATCAAAACT 


TATATCATCT 


CGATGTGGTC 


CGAATAAGCT 


AATGCCTCGT 


11280 


30 


TCTTTTTCTC 


TTTGCATATT 


ATCGCTAAGA 


ATAGACATAA 


TTTCTTCAAG 


TCGTGCCGCT 


11340 




TCATTTTGAG 


CATAATCAAA 


TTTAAGACTA 


GGTAAATAAT 


TCAGCGACAA 


CGCTTCTTTA 


11400 




TCATTTGTGA 


TACCAGCATG 


AATCGGTTTA 


GCTAACGACT 


CTAGCTCTTG 


AATAAAATGT 


11460 


35 


GCACGTTTAT 


CAGTTACTTT 


CATTGCATAT 


TCAGCAAACT 


GCTGATTTAA 


TACTTCCAAC 


11520 




ATTGTTAAGT 


CCTI-1-IT1TG 


GCCTAATTGT 


AACTGCTTTA 


AGTAATTATT 


CTTTTGCTTT 


11580 


40 


AAAATACGTT GGTATTGAGC 

" ATATCTATAA"AGCX3TCGTCT" 


TAAATCATTT 

^TTtGrGGf" 


AAGTAAACAG 


CAGAAATTTG 


GCCCAACTCC 


11640 




GAGCCrriTA 


CAATATTCAA 


ATCTTCTGGC 


11700 




GCAAATAGAA 


CCACATTGAG 


GTGTCCAATA 


TATTGAGTTA 


GACGACTTTG 


CTCTAAGTGn 


11760 


45 


ATTCACTTTG 

TGT 


GACTTGTTTA 


CCTTTnTTAG 


TTATAAACAT 


TGTTAATGGG 


CATCGTGCGG 


11820 
11823 



(2) INFORMATION FOR SEQ ID NO : 137: 



SQ (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 692 base pairs 

(B) TYPE: nucleic acid 
<C> STRANDEDNESS : double 
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<xi> SEQUENCE DESCRIPTION: SEQ ID NO: 137: 



5 



15 



ATAATTATTA 


ACATGGTGTG 


TTTAGAAGTT 


ATCCACGGCT 


GTTATTTTTG 


TGTATAACTT 


60 


AAAAATTTAA 


GAAAGATGGA 


GTAAATTTAT 


GTCGGAAAAA 


GAAATTTGGG 


AAAAAGTGCT 


120 


TGAAATTGCT 


CAAGAAAAAT 


TATCAGCTGT 


AAGTTACTCA 


ACTTTCCTAA 


AAGATACTGA 


180 


GCTTTACACG 


ATTAAAGATG 


GTGAAGCTAT 


CGTATTATCG 


AGTATTCCTT 


TTAATGCAAA 


240 


TTGGTTAAAT 


CAACAATATG 


CTGAAATTAT 


CCAAGCAATC 


TTATTTGATG 


TTGTAGGCTA 


300 


TGAAGTTAAA 


CCTCACTTTA 


TTACTACTGA 


AGAATTAGCA 


AATTATAGTA 


ATAATGAAAC 


360 


TGCTACTLCA 


AAACiAAACAA 


LAAAACCTTw 






AlLAlVJloL 1 


4 Z U 


TGGTAGAGAG 


CAATTCAATG 


CCCATAACAC 


ATTTGACACT 


TTTGTAATCG 


GACCCGGTAA 


480 


CCGCTTTCCA 


CATGCAG CGA 


GTTTAGCTGT 


GGCCGAAGCA 


CCAGCCAAAG 


CGTACAATCC 


540 


mTTATTTATC 


TATGGAGGTG 


TTGGtTTAGG 


aAAAACCCAT 


TTAATGCATG 


CCATTGGTCA 


600 


TCATGTTTTA 


GATAATAATC 


CAGATGCCAA 


AGTGATTTAC 


ACATCAAGTG 


AAAAATTCAC 


660 


AAATGAATTT 


ATTAAATCAA 


TTCGTGATAA 


nA 






692 



(2) INFORMATION FOR SEQ ID NO: 138: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7900 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
CD) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 138: 
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ATACTGTAGC 


GCAAATTTCA 


CAATGGCATG 


TTATAGAAGA 


TTTAGTTACG 


AATGAATTAG 


60 


GTATTAGTAT 


TTTACCAACA 


TCAATTTCAG 


AgCAACTAAA 


TGGAGATGTG 


AAGCTGtACG 


120 


CATTGAAGAT 


GCTCATGTAC 


ATTGGGAATT 


AGGTGTTGTT 


TGGAAGAAGG 


ATAAACAATT 


180 


AAGTCATGCC 


ACAACGAAAT 


GGATAGAATT 


TTTGAAAGAC 


CGTTTAGGCT 


AACATATTAA 


240 


TAAAGCACTC 


ATTATTTAAG 


GCGCATCATT 


ACGTGGGTCA 


TTGAAATAAT 


GAGTGTTTTT 


300 


TTGTGAAAAT 


GAAGTGAAAT 


TTAGAGAGCG 


TTTCCATAGA 


AAATAGTAAT 


ACAAACTATA 


360 


AAAAAAGAGT 


ATTTTTATAT 


TGTGTACGCC 


ATCTTTATAA 


TAGTTATTGT 


AACAATTTAG 


420 


ACATATTTAG 


AAAGGGATGG 


CGCCATGCAC 


AAAGTCCAAT 


TAATAATCAA 


ACTACTACTA 


480 


CAACTAGGAA 


TCATCATTGT 


GATTACTTAT 


ATTGGCACAG 


AAATTCAAAA 


GATTTTTCAT 


540 
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AI loTACCGC 


: TAACTTGGGT AGAAGACGGT 


GCAAACTTTT TATTAAAGAC 


GATGGTCTTT 


660 




TT CTTCATAC 


CGTCAG TTGT AGGtATTATG 


GaTGtgCTTC 


/V 1 R JV TV 1 1 »M mm 

CvaAAATTACG 


CTAAATTATA 


720 


5 


X J\\~ 1U1 1 1 1 1 


CGCAGTCATT ATCATAGGAA 


CATGTATCGT 


I vj CA x i ATCT 


TCAGGTTATA 


780 






AATGTCyG t T AAACwTAAAC ATCGTAAAGG 


TGT AG ACG C t 


TATGAATGAT 


840 




TACGTGCAAG 


CCTTATTAAT CZ^TT*TTfZ*VTrz 


ACTGTCGTTT 


TATATTATTT 


GGCTAAAAGG 


900 


10 


I 1ALAAUAAA 


AATATPPP.AA rrTtTTmv 


AATLlAG CAT 


TAATTG CATC 


TTTAGGAATT 


960 




ATTTTTGTCT 


* x X X v- X X X uu/ui 1 ± >\\jr x 


TATAACGGGT 


ATATGAAAGG 


TGG CAGTTGG 


1020 


15 


ATCAACCATA 




TGTTTAGCGT 


ACCCACTTTA 


TAAAAATAGA 


1080 


GAGAAAATTA 


A Af2AP7l A*TY5*P PTPTR'Pr'H*T*r 


TTTGCAAGTG 


TATTAAc TGG 


CGTCATGCTG 


1140 




AATTTCATGT 


TTAi J'lV 7A TV /*^TV !• 1 » T\ TV IV 

* «V» IVjl ±\~± X aalavh aaa 


GCATTTGGCT 


ATTCTAAAGA 


CGTCATTGTA 


1200 


20 


ACGTTATTGC 




GTAGGTATCG 


AAGTGTCACA 


TGAACTAGGT 


1260 


GGTACAGATA 


v-tj/^xvjA^^Vj x AL 1 ill 1 A 1 I 


ATCACAACGG 


GTTTAATCGG 


TAGTATTTTA 


1320 




GGTTCGATGT 


TATTAAGATT TGGAAGATTT 


GAATCTTCTA 


TCGCCAAAGG 


ATTAACGTAT 


1380 


25 


GGGAATGCGT 


CACATGCATT TGGCACAGCT 


AAAGCACTAG 


AAATGGATAT 


TGAATCCGGT 


1440 




GCATTTAGTT 


CAATTGGGAT GATTTTAACT 


GCAGTTATTA 


• 

GTTCAGTGTT 


AATACCTGTT 


1500 




CTAATTTTAT 


TATTCTATTA ATTTAGATAT 


TTAAAATGAT 


AGACAGAAAG 


GGAGGCTATT 


1560 


30 


AGTAATAATG 


GCAAAAATAA AAGCAAATGA 


AG CATTAGTT 


AAAGCATTAC 


AAGCaTGGGA 


1620 




TATAGATCAC 


TTGTATGGTA TTCCAGGAGA 


CTCAATCGAC 


GCATAGTCGA TAgTTTACGT 


1680 




ACAGTGAGAG 


ATCAATTTAA ATTTTATCAT 


GTACGTCATG 


AAGAAGTAGC 


AAGCTTAGCG 


1740 


35 


GCTGCTGGTT 


ACACAAAATT AACTGGTAAA ATCGGTGTGG 


CATTAAGTAT 


CGGTGGCCCT 


1800 




CSGniAATTC 


ATTTATTAAA TGGTATGTAT 


GATGCCAAAA 


TGGATAATGT 


ACCGCAATTA 


1860 




ATATTATCTG 


GACAAACGAA TAGTACAGCA 


CTTGGAACGA 


AAGCATTCCA 


AGAAACAAAT 


1920 




TTACAAAAAT 


TATGTGAAGA TGTAGCCGTT 


TATAATCACC 


AAATTGAAAA AGGTGACAAT 


1980- 

2040 




GTGTTTGAAA 


TCGTTAACGA AGCAATTCGT ACGGCATATG AACAAAAAGG 


TGTAGCTGTT 




GTTATTTGTC 


CTAACGACTT ATTAACTGAA 


AAAATTAAAG 


ATACAACGAA 


TAAACCAGTA 


2100 


45 


GATACATCAA 


GACCAACAGT AGTATCACCA 


AAATATAAAG 


ACATCAAAAA 


AGCGGTTAAA 


2160 




CTAATTAATA 


AAAGTAAAAA GCCTGTCATG 


TTAATTGGTG 


TAGGTGCGAA 


ACATGCGAAA 


2220 


50 


GATGAGCTAC 


GTGAATTTAT TGAAATGGCT 


AAAATTCCTG 


TCATTCATTC 


ATTACCAGCT 


2280 


AAAACAATCT 


TGCCGGATGA TCATCCATAT 


AGTATCGGtA 


ACTTAGGTAA 


AATCGGTACC 


2340 
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730 



CCATATGTGG ATTACTTACC TAAGAAAAAT 
AAAAATATCG GACATCGTTT CAATATTAAT 

5 TTGCATCAGT TAACTGAAAA TATTAAACAT 

TTAGAACGTA AAGCGGTTTG GGATAAATGG 
CCATTACGTC CAGAACGATT AATGGCATCA 

W ATTTCAGCAG ATGTAGGTAC AGCAACAGTT 

AATAACAAGT TCATCATTTC AAGTTGGTTA 
ATTGCATCAA AAATTGCATA TCCAAATAGA 

15 TTCCAAATGG TAATGCAAGA CTTCGCTACA 

TTTGTACTTA ATAACAAACA GTTAGCATTT 
TTAGAATATG CAGTTGATTT TTCTGATATG 

20 

GGTAAAGGTT ATACAATTAA GAGTGCTAGC 
GCACAAGATG TACCAACGAT TGTAGATGTA 
GGTAAAATTG TAAATGAAGA AGCGCTTGGT 

25 

GAAGATAAAC ATTTAGATTT AGATCAAATT 
TTATAACTGA TTTAAAGGTT ATCACAATTG 
TCAACAAAAT GGGAATTGCC GTTTTGTTTA 

30 

ATAAAATTGT GAAAAAGTTG TTGAAAACGC 
AGATATCACT TGCGTGTTAC TGGTAATGCA 

35 AGTCTTGTTT GTTCATGCCT GCTTTTTTTG 
GTTTSTATGT TTAAGAAATT GTTTGGACAA 
CCTGTTGCGA TTTTACCAGC AGCTGGTATT 

40 GAACAATTAG TAGAAATTGC ACCATGGTTA 
GTCATGGAAG CAGCAGGACA AGTTGTATTT 
ACAGCACTTG GATTAGCAGG AGGAGACGGT 

45 TTAATTATGA ATGCAACAAT GGGGAAAGTG 
TATGCCAAAG GGGCAAAAGA ATTAAGTCAA 
TTAGGTATTC CAACGTTACA AACGGGTGTG 

50 GCATGGTGTT ACAACAAATT TTATAATATT 
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ATTAAAGCCA TTCAAATTGA CACAAATCCT 24 $0 

GTAGGAATTG TTGGAGATAG TAAAATTGCG 2520 

GTTGCTGAAA GACCATTCTT AAACAAAACG 2 580 

ATGGAACAAG ATAAAAATAA TAATAGTAAA 264 0 

ATCAATAAAT TTATTAAAGA TGATGCAGTG 2700 

TGGTCAACTC GATACTTAAA CCTTGGTGTA 2760 

GGTACAATGG GTTG CGGTCT TCCAGGTGCA 2 820 

CAAGCCATCG CAATTGCTGG TGACGGTGCA 2 8 80 

GCAGTACAAT ATGATTTACC TTTAACTGTA 294 0 

ATTAAATATG AACAACAAGC AGCTGGTGAA 3000 

GATCATGCAA AATTTGCTGA GGCAGCAGGT 3060 

GAAGTAGATG CTATAGTCGA AGAGGCATTA 3120 

TATGTTGATC CTAATGCTGC GCCATTACCA 3180 

TATGGTAAGT GGGCATTTAG ATCAATTACT 324 0 

CCACCAATTT CAGTGGCAGC AAAACGTTTC 3 300 

AATTGAACTA TAAAAACGGT AATTTCTATT 3 360 

TTTATCACAA ATGATCGTAC TGAATTGATG 3420 

TTTTACAAAT ATGTATAATA GCTATGAATT 34 80 

GGCATGAGCA AACAACCGCA CTATGAGAAT 3 54 0 

TACATGGAAG CGGAAATTGA GATAGGGGAT 3 600 

TTGCAACGTA TCGGTAAAGC ATTAATGTTA 3660 

TTATTAGCGT TTGGTAACGC AATGCACAAC 3720 

AAAAACGATA TCATTGTAAT GATTTCGTCG 3780 

GATAACTTGC CATTATTATT TGCAGTTGGT 3 840 

GTTGCAGCAT TAGCAGCGCT AGTAGGTTAC 3 900 

TTGCACATTA CAATTGATGA CATTTTCTCA 3 960 

GCAGCGAAAG AACCAGCACA TGCTTTAGTA 4 020 

TTTGGTGGTA TTATCATGGG TGCTTTAGCC 4 080 

ACACTACCAC CATTTTTAGG ATTCTTTGCA 414 0 
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AGCTTTGCGT GGCCACCAAT TCAAGATGGA TTAAATAGTT TATCGAATTT CTTATTAAAT 
AAAAATTTAA CATTAACAAC GTTTATATTC GGTATTATTG AACGCTCATT AATTCCATTT 
GGTTTACATC ATATTTTCTA TTCACCGTTC TGGTTTGAAT TCGGAAGTTA TACAAATCAC 
GCAGGTGAAT TGGTTCGTGG TGACCAACGT ATTTGGATGG CACAATTGAA AGATGGCGTA 
CCATTTACTG CTGGTGCATT TACTACTGGT AAATATCCAT TTATGATGTT TGGTTTACCA 
GCGGCGGCAT TTGCTATTTA TAAAAATGCA CGACCAGAAC GTAAAAAAGT CGTGGGTGGT 
TTAATGTTAT CAGCAGGATT AACTGCATTT TTAACTGGTA TCACTGAGCC ATTAGAATTT 
TCATTCTTAT TTGTAGCACC AGTACTTTAT GGAATTCACG TATTATTAGC TGGTACATCA 
TTCTTAGTAA TGCATTTATT AGGCGTTAAA ATTGGTATGA CATTCTCAGG TGGTTTCATA 
GATTATATTT TATATGGTTT ATTAAACTGG GATCGTTCAC ACGCATTATT AGTTATTCCA 
GTCGGTATTG TATATGCTAT CGTGTATTAC TTCTTATTCG ACTTTGCAAT TCGTAAGTTT 
AAATTGAAAA CACCAGGTCG TGAAGATGAA GAAACTGAAA TTCGTAACTC TAGTGTCGCA 
AAATTACCAT TTGATGTCTT AGATGCAATG GGTGGAAAAG AAAACATTAA ACATTTAGAT 
GCATGTATTA CACGTCTACG CGTAGAAGTG GTTGATAAAT CAAAAGTAGA TGTAGCAGGT 
ATTAAAGCTT TAGGCGCATC AGGTGTATTA GAAGTTGGAA ACAATATGCA AGCTATCTTT 
GGTCCAAAAT CAGATCAAAT TAAACATGAT ATGGCCAAGA TTATGAGTGG TGAAATTACG 



5160 

30 AAACCAAGTG AAACGACAGT GACTGAAGAA ATGTCAGATG AACCAGTTCA CGTAGAAGCA 522 0 

CTTGGAACAA CAGACATCTA TGCACCAGGT ATCGGTCAAA TCATTCCATT ATCAGAAGTA 
CCTGATCAAG TATTCGCTGG TAAAATGATG GGTGATGGTG TTGGCTTTAT CCCTGAAAAA 
3S GGTGAAATTG TAGCACCGTT TGATGGTACA GTGAAAACAA TCTTCCCTAC GAAACATGCG 

ATACSSATTAG AATCTGAAAG TGGCGTCGAA GTACTTATTC ATATTGGTAT CGATACAGTG 
AAACTGAATG GTGAAGGATT CGAAAGTCTG ATTAACGTTG ATGAAAAAGT AACACAAGGT 
40 CAACCATTAA TGAAAGTGAA TTTAGCATAC TTGAAAGCAC ACGCACCAAG CATCGTTACA 

CCAATGATTA TTACAAATCT TGAAAATAAA GAACTTGTCA TTGAAGATGT ACAAGATGCT 564 0 

GATCCAGGTA AGCTAATTAT GACAGTCAAA TAATGATTAA AAATGAAACA GCATATCAAA 5700 
TGAATGAACT TTTAGTCATT CGTAGTGCGT ATGCGAAGTA GCGAGTTGAA AGAGAATACG 5760 
TTACAAAAGG CAGTAGCTTA AAATGAAGCT ACTGCCTTTT TAGTGCGCAA TGATGTATAG 5820 
CAGGTGTGTT GATGrTAATA AGTTAAATAT TAGTGTTAGA TATAGAAAAC ATTGCTTATG 5880 
TTTTTGTCAC ATTTTAGAAA AATGCATCTT CGCGACTAGC CAAATTAATA GTCTCATTGA 



5280 
5340 
5400 
5460 
5520 
558CL 
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AATAAATTAA CATGATTTTA AATCTATTTG TAAGATAAGG AGATTTGTCA TTATGACAAC 6060 

AGAAGGTCTA TTAGTTGCAG AGAAAGAAAT CGAAGTGAAT GGTTACGACA TTGATGCGAT 6120 

GGGTGTCGTT AGTAATATCG TTTATATTAG ATGGTTCGAA GATTTGAGAA CAGCGTTTAT 6180 

TAATCAGCAC ATGAATTACT CAACAATGAT CAATCAAGGC ATTTCACCTA TACTTATGAA 624 0 

AACGGAAGCA GAGTATAAAG TACCTGTCAC AATACATGAC AAAC CAGTAG GTCGTATTTA 6300 

CTTAGTTAAA GCAAGCAAGA TGAAATGGGT GTTTCAGTTT GAAATTGTGT CCGCACATGG 63 60 

CGTGCATTGT ATTGGTACAC AGACAGGCGG TTTTTACAGA TTGAGTGATA AGAAGATAAC 6420 

CTCTGTGCCA CAAGTGTTTC AAGACATTTT AGCAACAAAA TAATGACTTC ATTTTAAAAT 6480 

ATAAAAAGTA AGAAGGTGTT CGAAATGGTT AAGCAATTAA ATAGTGTCGA AGCATTCCGT 6540 

GAATTTATTC ATCAATATCC GTTAGCAGTT GTACATGTCA TGCGCGATCA GTGTAGCGTG 6600 

TGTCATGCCG TTTTACCACA AATTGAAGAC TTGATGCAAT CATATCCCAA TGTGCCATTA 6660 

GCTGTGATTA ATCAAAGTCA GGTGGAAGCT ATTGCTGGAG AATTAAATAT TTTCaCTGTA 6720 

CCTGTGGATT TAATTTTTAT GAATGGAAAA GAAATGCATC GTCAAGGGCG TTTTATCGAT 6780 

ATGCAACGTT TTGAACATCA TCTTAAGCAA ATGAATGATA GTGTAAATAA CGATGTCGAT 684 0 

GAGCATTAAT ATCGCAAATG ATTAGCATTG CTAAGATTAT GTAGACATCA TAACTTATTT 6900 

CCCAGTAAAT ATTGGTAGTA ATTAGAATCA GCATGGTACA GTAGAACTAT AGTAGAAATC 6960 

ATCAAAGAGG AGTGACGACA AATGCGTAAA AAATGGTCTA CACTTGCGTT TGGATTTTTA 7020 

GTTGCAGCAT ACG CACATAT TAGAATTAAA GAAAAACGCA GTGTGAAAAG TTATATGTTA 7080 

GAACAAGGTA TACGATTATC TAGAGCTAAG CGTCGTTTTA TGTATAAAGA AGAAGCGATG 7140 

AAAGCATTAG AAAAAATGGC GCCACAGACA GCAGGCGAAT ATGAGGGAAC CAATTATCAG 7200 

TTTA&GATGC CAGTAAAAGT GGATAAGCAC TTCGGTTCAA CCGTTTATAC CGTTAACGAT 7260 

AAACAAGATA AGCATCAACG CGTTGTATTA TATGCACATG GAGGCGCATG GTTCCAAGAC 7320 

CCACTCAAAA TTCATTTCGA ATTTATTGAT GAACTTGCAG AAACACTCAA TGCTAAAGTC 7380 

ATCATGCCAG TATATCCGAA GATTCCGCAT CAAGATTATC AAGCGACGTA TGTGCTTTTT 744 0 

GAAAAGTTGT ACCATGATTT ATTGAATCAA GTAGCAGATT CTAAACAAAT CGTTGTAATG 7500 

GGTGACTCTG CGGGCGGTCA AATTGCTTTA TCATTTGCTC AATTGTTAAA AGAAAAACAT 7560 

ATTGTGCAAC CAGGACATAT TGTATTAATT TCACCAGTTT TAGATGCAAC GATGCAGCAT 7620 

CCTGAAATTC CTGACTACTT AAAGAAAGAC CCAATGGTAG GTGTGGATGG CaGTGTGTTC 7680 

TTAGCTGAAC AATGGGCAGG GGACACACCT TTAGATAACT ACAAAGTATC ACCAATTAAT 7740 
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CCAGATGCTT TGAACTTATC GCAATTGTTG AGTGCGAAAG GTATCGAACA TGACTTTATA 
CCTGGATATT ACCAATTCCA TATTTATCCA GTATTTCCGA 
(2) INFORMATION FOR SEQ ID NO: 139: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1984 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 139: 

75 





GTCTAAATAA 


ACAAAATTAT 


CATTGATTaC 


TGAACTGGCA 


TTTCGAAGTA 


ATGCTTCAAT 


60 




ATCATTCGAA 


TATTTCTTCA 


ATTTATGATT 


GTGAAATAAT 


TCTTGCATCA 


AAAATGGTCT 


120 


20 


TTGGTCACAT 


GAATGTGCAT 


CTGAAGCTAC 


AAAATGAGCC 


AAATTACATT 


CTATAAATTG 


180 




TAATGATAAC 


TTTTGAATGT 


TTTTACCAAA 


TCCACCAACT 


AAAGAACTCG 


ATGTTAATTG 


240 




ACTCAGTGCC 


CCATTTGCAA 


CCAATTCATA 


TAATATTTCC 


ggatttttgg 


CGATACTTCT 


300 


25 


ATTTCTTTCA 


GGATGTGCAA 


TGATTGGTAT 


GTAACCTCTC 


GATTGTATTT 


CAAAAAACAA 


360 




TTGTTTTGTA 


TAATGTGGTA 


CTTCGCCCGT 


TGGAAATTCA 


ATTAATAAAT 


ATTTCGAACG 


420 




ATTAATACCT 


TGAATACTAC 


CATTATCTAA 


GCCTTTCAGA 


ATCGAATCTG 


TAATTCTAAT 


480 


30 


TTCTTGCCCG 


GGAAATAATT 


TAATATCCAA 


TGCTTGAACT 


TCTGGATGCG 


TTCTTAACTC 


540 




CGCCAATTTC 


ACAAGCACTT 


GTTGAAATGT 


ATTATCATAT 


CTCGGATGCA 


AATGATGAGG . 


600 




TGTCGCTACA ATACTTGTTA 


CACCTTCATC 


CTTAGCTTGC 


TTTAATAGTG 


CAATACTCTT 


660 


35 


TTCAATTGTT 


TTAGGACCAT 


CATCTATATC 


AACTAATATA 


TGGTTATGAA 


TATCAATCAT 


720 




GATTCATCAG 


TCCCATAATA 


TGCATAGTAA 


CTAGCACTTT 


TATCTTTAGG 


CATTCTATTT 


780 




AAGACTACAC 


CTAATAATTT 


AGCACCTGTT 


GCTTCAATAA 


GTTCTTTTCC 


TTTTTTAACT 


840 


40 


TCATCTCTAT 


TATTATTTTC 


CGAATTAACT 


ACGTAGACAA 


C^^TGCCGGT_ 


AAACTTTGAA 


... .900 




AATAATTGCG 


CATCTGTAAC 


TGTGTTCACT 


GGTGGCGTAT 


CGATAATTAC 


AAAGTTATAA 


960 




TTCATCAATA ATGTGTCATA 


CAAATTTGCA 


AATGCCCTTG 


ATGTAATTAA 


CTCTGACGGA 


1020 


45 


TTCGGTGGGA 


TTGGCCCAGA 


CGTCAAGACG 


TCTAAATCTT 


GAATTTCAGT 


TGAGATAATA 


1080 




CTGTCTTGAT 


AAGTTGACCA 


ATTTAGCAAT 


AAACTTGATA 


GGCCTTCATT 


GTTTGGCAAA 


1140 


SO 


TTAAAAATAT 


AATGCTGCGT 


AGGTTTACGC 


ATATCCC CGT 


CTACGATTAG 


TGTTTTATAA 


12 00 


CCTGCTTGCG 


CATATGCAAC 


TGCTAAATTT 


GCTGCAATTG 


TAGACTTACC 


TGCGCCTGGT 


1260 
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GATCTTATGC CTCGAAATTT CTCGCTAATA GGTGACTTTG GTTGTTCATG GACAATTAAA 
CTTGATGTAC TTCyTCGTGT ATTCGTCATG GTAATTCCTC GTAAATTAAA ATTTTTGTAT 
TGAACCTAAA ATAGGTAATC CTAGTTGCGA TTCAACATCT TCTTCTGTCT TAATACGCTT 
ATCTAATAAT TCTTTTAAGA AAATAATCAA TATTGCTAAA ACAATACCAA CAATAATGCT 
GATAACTAAG TTGACAGATA CTATTGGAGA TACTTTTACA GCATTATCAT GTGCTGAGGA 
AAGTATCGTA ACATTATCAA CACTCATAAT TTTAGGCATG TCATGAGCAA AAACTTTAGA 
TATTTTATTA ACAATTTTGT CAGATTCAGA TTTATTCCCA GTGGTAACTG ATACAGTAAT 
AATTTGAGAG TTTGTTTGAT TGGTTACTTT TAAAAATGAA TTCAACTCAG CTGTTGAATA 
CTGACCATCA AnTTCTCTAG ATACTTTATC TAGAATTCTA GGACTTTTGA TAATTTCCGT 
ATATGTATTA ACAGACTGCA AACTACTTTG AACATTTTGG AAAGCTAAAT CACTTGAGGA 
CTTTTTCATG TTCACTAATA TTTGAGTAGA AGCAGTATAT TTGTCAGGCA TAACAAAAAA 
GGTT 

(2) INFORMATION FOR SEQ ID NO: 140: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6272 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: 



CAAATCCCTT 


GGTGATGAtA 


AAtGtATTGC 


CTGACGTTCA 


ACAACAGCTT 


GCAATCGTTT 


GAGACCATAT 


TCAATTTTAA 


GTTGCTCATT 


TATCATTGTT 


ATAATCGTTC 


CAATAATATA 


TAATACTGAA 


ATACTTACAA 


TTTGAACCCA 


TGGGATCAAC 


TCTCTTACAG 


CCCCGTAAAT 


GGCGCCACTG 


GTCATTGCCA 


TAAATAGTGA 


GCGTTTATTT 


TTCTGATTAA 


GCATACTATC 


TGCGATGTCT 


TCCACATTAC 


CTTCAATGTC 


AGACTTTTGC 


GCCACTTCTG 


TCTTCAACTC 


ATATTCACCT 


TGTTTTTTCG 


AAATAACACT 



SEQ ID NO: 140: 

: TGTGTAGCCA AATAATCTTC GTATATATGA 
1 CGTTGGTACA GTTACTTTCT TCTTGTTAAA 
1 TTCAAGCATC ACCGAAAAGC CATAAAATCT 
i TGCCACTATT AATACTAGTA AAATGATGAT 
i TTGACTAATT TCATGATTTA GCTTCGACCA 
' CGGTACTAAA GCTGCTAACG TTACACCAAT 
i TTCTTTAAAA TTCATCTGAT ATATAGGAAT 
■ AGTGTTCTGC ACTTCATCTA AGCGACCTTC 
: ATGATTACAG TTGTCATTCT TCTCAGCACT 
: TGTTTGCAAT TGATCAATAT ATCGTTCAAG 
' TAAGACAATA CCATCACTTG GTGTTTTGAT 
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20 



25 



40 



45 



AATACGTTTT ATATTTAATT CTTTACGCTT TTTATTAAAA ATACCTGTTG TTAAAATGAA 
ATAATTATCC tCAATCCAAT ATCGCGTGTT CATAATTCCG ACAATTTGAG AAATGTATGA 
TATTAAAAAG AATACAAATA CAATACCTAT CCATAAATAT GATTCGGGAT TCGTATAATC 
AAAATCTTTC AATTGAAAGA TAATGAAAAT AAAAAAGACG ACTATGTTTT GTTTGATAGC 



780 
840 
900 
960 

w ATTGATTATG CCATTAAAAT ATGAAATCGG ATGTAATTTT TCAGGTTCAG ACATCACTTT 1020 

CAACCCCTCT CAAATTCGAC ATAGTTCTCT CTTCGATTAT TTTAACATCG TCATGAGACA 
TCATCGGTAA ATAAATAGTA TGACCTGCAG TCATAAATCC AACTTTATAC AAATTAAGCA 
, 5 CTTTACTAAT TGGATTAGAT TTAATCGACA AGTATTGTAA ACGTTCAATT CGACTCGTTT 

CTTCTTTATA TATAAAAAAT GATGTACGAT ATTGTACACT TAGTTGATCA ACTTTATAAA 
AGCGACAATG ATATTG C CAT AAAGGCTTAA TAAATAATTT TAATGTACTC AGAGCACCTA 
AAACCAACAA AATATAAAGT AAGTAATGTG GCCATTCAAA TCTTAAC CAT ATAAAATAAA 
AAATGACATA CACAGCTACA CTCAATATAA ATTCTAAGCC ATTCGTAATG TAGTAATACA 
ACAATGCTGA CTTAGG ACT C TTAGTCAACT TAGTATAATC TGACATATAC CCCTCTCCCC 
AAATAAAAAA TTATACGGAT TTATAATCTA TTTCATTTTA TTTTTATATG ATGATAATTA 
TAGCATATGG AATATTTCAT GCTAATTTAT TCTTCCTAAA GGTACATCTA AAAATTTAAT 



3Q TAAGCAGAAA GTGCTTGAAT TGCTAAAAAG ACACCATGTT ATAATTTTAT CAACATGATG 1680 



TAATCCATAA ATCAACATAT TATTTATAAA GATTCTATCA ATG CTGTAAC CCTTTACTTT 
TACACCTTTC ATGGCAATTG GAATTAAGGC AACAATGATT AATGCATTGA ATATCAAAGC 



X080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 



CCTTTCATCT ATAATCAATC TTTCATCTTA TCAAGAGCGA TATTTAGTTC AAGCACATTC 
ACATAATCAT TTGTTAACAC ACCACGCTGC TTACGATGTT GAATCAAGTC GGCCACTCTT 
35 GAAGTAGATA CATGACGAGC ATCAGCAATA CGAGGTGCTT GCTTCAATGC ATTTTCGACC 

GTAATATGCG GATCTAAGCC CGACCCAGAA CTTGTTGCAG CATCTATTGT TACATTTGAA 
TTCCCAAATT TAACATGATG TTTCATGCGT GCTATTAATT CGGTGTTTCC ATTCGATTCA 

." ACTTC?CAC _. CTG/ ^ AGATAC ^OTTTTTA TATAATTTTT CAGGATTCAT ATTATAATCA 2040 

ACTGCACTCG GTCTCCCGTG AAAATATCGT GTCTCTGTCC AGTGCTGTCC AATCAATTTT 2100 
GATCCAACTA TACGATTGTC ATACGTAATT AAACTGCCAT TTGCTTGTTG ATAAAAAAAT 2160 
ATTTGACCAA TTAACGTGAT AGCTAACGGG AATAAAAATC CACATAATAC CATAGTTATT 



1740 
1800 
1860 
1920 
1980 



2220 



ATCGTTAAAC AAATACTATT TCTTATCGTA TTCATGGTAC AGGCTCCTTC CTCTTTACAC 22 80 

so AAAAAATTGT ACAATCATAT CTATTAATTT AATGCCTAAA AACGGGACGA TTAATCCACC 234 0 



2400 
2460 
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AATTGTTGAC ATCATTAGTG CAGGTAAAAT TGCAAAGTAT TTTGCTACGT CATTAGCCAA 2580 

ACTAAATGTC GTTAATGCAC CTCTCGTCAT TAATAATTGT TTGCCTATTT TTACAACCTC 2640 

TATTAACTTT GTAGGATTCG AATCTAAATC AATTAGATTA GCTGCCTCTT TAGCACTAAT 2700 

TGTCCCTGAG TTCATAGCTA AT CCTATATT CGCTTtGTGc tAGCGCAGGT GCATCATTTG 2760 

TACCATCTCC TGTCATCGCA ACAATATGGC CTTTCGCTTG TTCATCTTTG ATGACTTTAA 2820 

TTTTATCTTC GGGTTTACAC TCTGCAACAA ATCTATCAAC CCCGGCTTCT TTTGCAATTG 2880 

TAGCTGCTGT TAAAGCATTA TCACCTGTAC ACATAACTGT TTCAATCCCC ATTTTTCTCA 2 94 0 

75 ATTCAGTAAA TCGTTCTACA AGACCATCTT TAATCACATC TTTTAAATAA ATCACGCCAA 3 000 

GCATGACATT GTTTTCAATG ACT ATTAA t G GnGTGCCACC TTTACTCGAT ACATCCATAC 3060 

AG AGAGACT C AATATTAAGA GGAATATTGC CTTGTTGTTG TTTGACAAGA TTTATCATAC 3120 

TATTAGGTGC AC CTTTGAAT ACCGATATTT CATTTGTAAT GATTCCGCTC ATTCTAGTTT 3180 

CAGCTGTAAA AGG CTTATAT GTGCCATCAA TGTCTTTAGG CAGCTCATTT ATATACATcT 3240 

GcttCGCTAA TCGTACAATA CTTTTTCCTT CTGGCGTATC ATCGTAGATT GATGACATAT 3300 

AAGCAGCGAC TATCAATTTT TCAAGCATTT GTTGATTCAC TGGTAAAAAT TCACTAGCGA 3360 
TTCGATTGCC ATAAGTGATT GTGCCTGTCT TGTCTAAAAT CATTACATCG ACATCTCCAC , 34 20 

ATACTTCTAC AGCACGCCCA CTTTTCGCTA ATACATTGAA TTGAGTAACA CGATCCATGC 34 80 

CTGCAATACC AATCGCCGAT AACAAACCAC CGATTGTCGT TGGTATTAAA CATACTGTTA 3540 

ACGCAATGAG CATCG CAATA GGTAAAATTA AATGCAGGTA AGATGCTATT GGATATAACG 3600 

35 TTACAATAAC GACTAAAAAT ATAATTGTTA ACGTTGTTAA TAATGTAAAA AGTGCAATTT 3660 

CATTTGGTGT TTTATTTCTT TCCGCCCCTT CAACTAAGGC AATCATTTTA TCTAAAAAAG 3720 

ATGTACnCGC TTCACTCTCA ACACGTATTT CTAACCAATC AGATGTTACA AGTGTACCGC 3780 

CAATGACTCC ATCAAAATCG CCACCTGATT CTTTTATCAC AGGTGCAGAC TCACCAGTAA 3840 

TTGCAGATTC ATCAACGGTT GCTAATC CAT TTATTACAAC GCCATCAGCA GGGATTGTTT 3900 

CTCCATTTTC TACCCGAATA TTTTGTC CGG CTTTTAACTC TGTGGCGTTC ACTATCCGAT 3960 

ACGCACCATT TTCTTCTATC AATCGAGCAG TTAAATTTGA TTGTGCTTGT CTTAAACTAT 4 020 

CAGCTTGCGC TTTTCCACGA CCTTCAGCAA AGGCTTCTGA AAAATTAGCA AACAATATAG 4 080 

TTATTAATAA TATGATAAAA ATTGTAATCA AATAACCTCG CGATAGATAG CTAGTTCCAA 4140 

ATATGTCAGG AAAACATATT AATATCAACG TTAAAATCAT TCCAACCTCA ACGACAAACA 4200 

TTATCGGATT TTTTATTAAT TGTTTAAGAT TCAGCTTATA AAAACTCATT TTCAAAGCTT 4260 
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TTTATTTTAA AGTTAAAAAT TCACCAATAG GACCAAGTAA TAGTACTGGA ATAAATGTCA 

AACCACTTAG TAAAACGATA AATACGATTA GTGATACGCC AAAATAAGGT TTATCAATCG 

5 

CTATTGTATA TTTATCTTGA TGGTATGATT TTTTATTCAC TAAACTTGAT GCAATCATTA 

ATTGCAAAAT AATTGGTATA TAACGAGAAA GCAACATAAT GATTCCTGTA GAGATATTCC 

^ AGAATGTTGT ATCATCTTTC AGTCCTTCAA ACCCTGATCC ATTGTTCGCA GCAGCTGATG 4620 

TCATTTCATA CATAACTTGT GAAATACCAT GAAAAGACGG ATTCGTtATa CTTtCACTTG 4680 

CTCCAGGAAT CATAAAAGCA AGTGCTGAAA ATACTAAAAT TAAAATTGGG TGTATGAGAA 4 74 0 

15 AGACTAAGAC AATACATTTC ATTTCACGGG CGCCAATTGG CATATTTAAA TATTCTGGTG 4 800 

TTTTACCAAC CATCAAACTG CATATAAACA CCGTCAGTAA GACAAATATC AATAAATTCA 4 860 

TGAGTCCTAC GCCTTCGCCA CCAAATACAA CATTTAG CAT CATTAATACC ATTGGTCCTA 

ATCCACCTAT AGGCGTTAAG CTATCATG CA TGTT aTTaar " 

AG AJ\C G GG IT GTAAATGCCG 

TCGTAATAAC TGTAAATAGT GCTGACAAAC CTGGTCCAAA CCGTACCTCT TTACCTTCCA 5040 

TATTCGGTCC ATAAATGCCT AAATTCG CTA GTATTGGATT ACCACGATAC TCACTCCACA 5100 

TAGTTAATGT AAGAATTGCT ATAAAAATGA AAAACATTGC GACAAATAAT ATCAACGCAT 5160 

GACGATGTAC TCGTTTACCA TGTCTACTTA ACATGCGACC AAATAAGAAC AACATTGACA 5220 

TAGGAAGTAA CATCATACTG CCCATTTCTA TAAAATTGCT CCAAATATTT GGATTTTCAA 5280 

AAGGTGTTGC AGAATTTCCT GCTAAAAATC CTCCACCATT CGTACCAAGA TGTTTTATTG 5340 

ATTCAAGTGA TGCAATAGGT CCAAATGCAA TATGTTGAAT ATGTCCGCTT AAAGTCCGAA 54 00 

35 TCATTAAATT AGCATGCAAC GTTTGTGGTA CaCCTTGAGT CATCAATAAA ATACTAATTA 5460 

AACATGATAA TGGTAAAAGT ACTCGGACAA TAAACCGAAC AATATCTTGA TAAAAATTAC 5520 

CAATGATATT AGTTAATCCA GTTAAACGTC TCAACATCGC TATACAAACG GCGTAACCTG 5580 

ATGCACTAGA TGTAAACATT AAAT ATGT CA TTACAATCAT TTGCGTTAAA -TATGTCACAT - 564 0 

CTGaTTCACC GTTATAGTGT TGtAAATTAC TATTTGTTAA AAAAGATATT GCTGTATTAA 5700 

ACGCTAAATC TATCGATTGG TTTAAATTAT GATTTGGATT TAAAAAAAGC CATTGCTGAA 5760 

CTATTAGCAA TACAAATGTT ATAAACCCCA TAAATCCATT AAATGCCAGA AAATGTTTGA 5820 

CATATGTTTT AGCTGACATG TGTTCTAAAT CTGTGCCGAT AATTTTAAAA CACATATTTT 5880 

CAAATCTAGT AAATATTAAA TCTACTCTTG ACGATTGCAC CAATGCTACG CGATATAGAT 594 0 

ATCCACTAAA AACATACGTA ATCATAACCA TCATTGTTAG AAACAAAATT ATTTCCATGA 6000 

TAACCCTCAC TTAATATATT TCTAAAATTT TTCACTACGA ATTAAGGCAT AAAAT AAATA 6060 
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ACACAACAAC ATCGTAACAA C1TGTTTATG AGAGAAATnT 


TAATTTTCAA 


ACTTAGTTAT 


6180 




TAAGAAAnCA TTAAGATGTG TATGCAGAAA TAAATTTTAT 


AGCATTTAAT 


TGTGAAGAAT 


6240 


5 


ATTATGATAT TGCTATCGAG GTGAAGGTTA TG 
(2) INFORMATION FOR SEQ ID NO: 141: 






6272 


10 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1978 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 








15 


(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 141: 








AAATGATGTT TTACAATAAA TATAnAAACG TATCAACATA 


TATCATCATA 


TTTTTAGTTT 


60 


20 


CAAGTGCAGC CTTTG CAAT A IT CTTGTTAA GTGCGnACAT 


TAGTGCTCAC 


TCGGAACAAG 


120 




TGTACGAAAT GACTGACCAT CAAATTAAGA ACAATACGAT 


AAATAAAGCA 


TACGAACATA 


180 




AAGACCCTAC AAACAAT AG C GAACAAAGAG ATGGGAAAGT 


GTTCGCTTTA 


ATAAATTGAT 


240 


25 


ACATTGTCAC AACGTTATTT TGCCTATTTT TGCGmAATAG 


CGTTTTTTAT 


TACwTTTTTG 


3 00 ■ 




CTGATsTTAA ATTTGTTATA TTTTGTTAAA GTATTATAAT 


GATTGAATAA 


ACAAATTGAA 


360 




GGTAGGTTTT TTAATTGAGT AATTCTGATT TGAATATCGA 


AAGAATTAAC 


GAGTTAGCTA 


420 


30 


AAAAGAAAAA AGAAGTAGGA TTAACTCAAG AAGAAGCAAA 


GGAGCAAACA 


GCCTTAAGaA 


480 




AAGCTTATCT TGAGAGTTTT AGAAAAGGGT TTAAACAACA 


AATTGaAAAT 


ACTAAAGTAA 


540 


35 


TTGATCCAGr AGGTAATGAT GTAACACCTG AAAAAATTAA 


AGAGATACAA 


CAAAAAAGAG 


600 


ATAATAAAAA TTAAATCACA AATCTGTAAA GAATTTTCTG 


ACATTATAAC 


TTGAAATAAG 


660 




TATtTTACTT ATCTTTTTAT TTTAAAATAA GTTATAATGT 


ATTTGATAAA 


ATTGAAGAAG 


720 


40 


GGAAGATACA CAAGATGTTT AATGAAAAAG ATCAATTAGC 


TOTTGATACG 


CTACGTGCAC 


780 




TAAGTATCGA CACAATCGAA AAAGCGAATT CTGGTCATCC 


AGGATTACCT 


ATGGGAGCTG 


840 




CCCCAATGGC TTACACTTTG TGGACACGTC ATCTGAATTT 


TAATCCACAA 


TCTAAAGATT 


900 


45 


ACTTCAATAG AGACCGTTTC GTATTATCTG CAGGGCATGG 


TTCAGCATTA 


TTGTATAGCT 


960 




TGTTACATGT TTCTGGTAGT TTAGAATTAG AAGAATTAAA 


GCAATTTAGA 


CAATGGGGTT 


1020 




CTAAAACACC AGGTCATCCT GAATACAGAC ATACAGATGG 


TGTAGAAGTT 


ACTACCGGAC 


1080 


SO 


CACTTGGACA AGGTTTTGCT ATGTCAGTAG GATTAGCTTT 


ACAGAAGATC 


ACCTAGCAGG 


1140 




gAAATTTAAT AAAGAAGGAT ATAATGTTGT AGATCATTAC 


ACATATGTAT 


TAGCTtCTGA 


1200 
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AAGTAAATTA GTTGTTTTAT ACGATTCAAA TGATATTTCA TTAGATGGCG AATTAAACAA " 
AGCTTTTTCT GAAAACACAA AAGCTCGTTT TGAAGCATAT GGTTGGAATT ACTTACTAGT 
TAAAGATGGT AATGATTTAG AAGAAATTGA TAAAGCGATT ACTACAGCTA AATCTCAAGA 
AGGACCAACG ATTATTGAAG TTAAAACAAC AATCGGATTT GGTTCACCGA ATAAAGCAGG 
AACTAATGGT GTTCATGGGG CACCTTTAGG TGAAGTTGAA AGAAAATTAA CATTCGAAAA 
TTACGGTTTA GATCCTGAAA AACGTTTTAA TGTTTCAGAA GAGGTATACG AAATTTTCCA 
AAATACTATG TTAAAACGTG CTAATGAAGA TGAATCTCAA TGGAATTGAT TATTAGAAAA 168 0 

ATATGCAGAA ACATATCCTG AATTAGCAGA AGAATTTAAA TTAGCGATTA GTGGTAAATT 174 0 

GCCTAAAAAT TATAAGGATG AATTACCACG TTTTGAACTG GGTCATAATG GTGCATCTCG 1800 
TGCTGATTCT GGTACTGTTA TTCAAGCAAT CAGTAAAACT GTCCCTTCAT TCTTTGGTGG i860 
ATCAGCAGAC CTTGCTGGTT CAAACAAATC CAATGTAAAT GATGCAACTG ATTATAGTTC 192 0 

TGAAACACCT GAAGGtAAAA ATGTGTGGTT TGGTGTACGT GAATTTGCTA TGGGTGCT 1978 
(2) INFORMATION FOR SEQ ID NO: 142: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7588 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 142: 

TAGTAGTATT TATTAAATTA TACGAAGGGA CCcAACACAG AAAATTCATT TTATTGAATT 60 

TTACATTTAT GTGCCAAGTT GGGAAAAATG TCTTATTTTT TCaAAGTATT TAAAAGTAAA 120 

ATTACATGTT AATACGTAGT ATTAATGGCG AGACTCCTGA GGGAGCAGTG CCAGTCGAAG 180 

ACCGAGGCTG AGACGGCACC CTAGGAAAGC GAAGCCATTC AATACGAAGT ATTGTATAAA 24 0 

TAGAGAACAG" CAGTAAGATA TTTTCTAATT GAAAATTATC TTACTGCTGT TTTTTAGGGA 300 

TTTATGTCCC AACCTTTTTA GAATATTAAA TTTCTACAAT TTCGTCATCT TCAACAATAA 360 

AGCCCATTGT ATTGACGCTG TTATTTAAGA AAGT CAGAAT ATAACGCATT ACTTCATCAC 420 

GTTCTGGCTC ATTGTGAACC TCGTGGTAAA AACCTTGCCA AGCTTTAAAA TATAATTCAG 4 80 

GTGTTTGATA TTTTTCTTTA AACTCATCAA TTGCCCTAGT ATCAACAATT AAATCCTTCG 54 0 

TTCCATACAT TAATAGCGTT GGCATTGGTT GAATGTCATG AATATGAGCC ATCGTATCTT 600 

TCATCGTCTC ATTAATTGTA TTATACCAAT GATACGTTGC TTTTTTTAAC ATTAAACCAT 660 
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CATTAAAACG TGTGTCTTTT GAAATTTTAC CTATATTTGA AACAAGTTTA TCTTTACGAT " 780 

TTTTTCCATT CTTTTGAAGT TCTAG CAT AG GAGAAATTAA CATCATCCCC TCGATTGGCA 840 

ATTCTACTTT TTCAAGTAAA TTTAATAAAA TCAAACCGCC AAGTCCTACC CCTAATACAT 900 

AAGTAGGAAT TTTATATTCA TTAGCTATCT TTAACCAGTC TAGCAAACTT TCGTGATACG 960 

TTTGAAAGTT TTCAATTTGT C CTTT ATT AG CTCTTGAAGT TTGACCTTGA CCAGGCAAAT 1020 

CTCCCATAAT CACATGATAG CCATTTCTTC TTAACATCGT AATAACATAT GCATATCTTC 108 0 

CCGTATGTTC TAATATATTA TGAGCAATAA CAACGACGCC TTTCGCATCA TTTTCAGCTT 1140 

CCCACTTCCA CATTATTATA CTGCCCCTTT TTCATTAATC TTCAATAACA T AATT AT AG C 1200 

AAATTCACTA TGTAGATTTC TATTTATAGT ATTATTGTTG TCCATATTAT TATATATAAA 1260 

TGAAATCAAC ATCAATAATA GTGTAATTAT ACATAATTAT TTTTGATTGT TTTTGATGAA 1320 

AACGCTTTCT CGAATATTTT TTTCATGCTA AACTTATTGT AAACACAAGG GTTTGGAGGA 1380 

GTAGCAATGG CACTATTAAA GAATTTTTTT ATCGGATTAT CTAATAATAG TTTTTTAAAC 144 0 

AACGCAGCAA AAAAAGTGGG CCCACGTTTG GGCGCCAATA AAGTCGTTGC CGGAAATACA 1500 

25 ATTCCAGAGT TAATTAATAC AATCGAATAC TTAAATGACA AGAAT ATCG C TGTTACGGTA 1560 

GACAATTTAG GGGAATTTGT CGGTACAGTT GAAGAAAGTA ATCATGCTAA AGAACAAATT 16 20 

TTAACAATTA TGGACGCGCT TCATCAACAT GGCGTAAAGG CACATATGTC TGTTAAATTG 1680 

AGTCAGTTAG GTG CAGAATT CGACTTAGAA TTAGCTTACC AAAATTTAAG AGAGATTTTA 174 0 

CTTAAAGCAA ATACTTACAA CAATATG CAT ATAAATATTG ATACTGAAAA ATATGCTAGC 1800 

CTGCAACAAA TTGTTCAAGT TTTAGATCGC TTAAAAGGCG AATTTAGAAA TGTTGGTACT 1860 

GTAATTCAAG CATATTTATA CGATAGCCAC GAATTAGTTG ATAAGTACCA AGATTTACGA 1920 

TTACGTTTGG TTAAAGGTGC ATATAAAGAA AACGAATCAA TTGCATTTCA ATCTAAGGAA 1980 

GACGTAGATG CAAATTACAT CAAAATAATT GAACAACGTT TGTTAAACGC ACGCAATTTC 2040 

ACTTCAATTG CAACACATGA CCATCGCATC ATTAATCATG TAAAACAATT TATGAAAGAA 2100 

AATCACATTG AAAAAGATCG TATGGAATTC CAAATGCTCT ATGGTTTTAG ATCAGAGTTA 2160 

45 G CAG AAG AAA TCGCAAATGA AGGCTATAAT TTCACTATTT ATGTACCTTA TGGCGATGAT 222 0 

TGGTTTGCGT ATTTTATGAG AAGATTAGCA GAACGCCCAC AAAACCTATC TCTTGCTGTA 2280 

AAAGAATTTG TGAAACCTGC TGGCTTAAAA CGTGTTGGCA TAATTGCAGC TTTAGGAGCT 234 0 

50 ACAGTTATGT TAGGTTTAAG TACAATTAAA AAATTATGCC GTAAATAGAG CAAGACATAA 24 00 

ACAATAATTT AGGAGTCTGG AACAATAATC AATGTTCTAG GCTCCTAAAT GTTATATTGG 24 60 
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TAGATTTTAA 
CAGCTTTCCT 
ATATGACTGG 
AAACATAATC 
CATAATTTCC 
CAAATGCTAC 
CTTCAAGTAA 
AATCTTTTCC 
CCATTTTTAT 
CTTCAATTCT 
TATTACTTAA 
GATAATCTCG 
CTTGCTCAAT 
GAGGTAGATA 
GAGCACCACA 
AG CGTACATT 
TGTATGTCGC 
TTGCCTTAAA 
TAATCATCTT 
TGCCGTCATC 
CTAAATCAAC 
CTAATGGAAA 
GCTTTTTGGC 
CAATACTCAC 
AATCCAAACG 
TCGCCATAAA 
CATTTTCACG 
AAGCACTGTC 
TTATCTACAG 



TAAATTAGCC 
ACCTGCTCTT 
TACATTAGTT 
ATAATGAGAC 
TGATGAGGCT 
ATCAATATTG 
TCTTCCAGTG 
AATTAATTTA 
TTTTTTCGTT 
TTCTGCAATA 
TAAATTGATA 
CAAATCTTCA 
TAATTCATAT 
AATAATCATG 
ATCACAACGT 
TTCATGTTGT 
TTTAAAACCA 
TTCAATTTCT 
TAATTGATGT 
ATTCATAATC 
AGCCGCTTCT 
TAAATGACCA 
AGTCAATGTA 
TGTAAATTGC 
TTGTGCAATA 
ATTAATGGTA 
ATTCTCATCA 
AATATTATCG 
ATAATTGGTC 



ATTTCAATTG 
TCCACAGCTT 
TGATCATTCA 
GTAGCACCGC 
AATTTTTTAG 
TCTTCATTAA 
ATAAAATCAT 
CCTTCAAAAT 
TCCATATAAT 
TCAATGCCAT 
TGTTCGATGT 
TCAAAACCTA 
GCGCGTAATT 
CCACCATGTT 
TGACTATGGA 
CGAATTGCAC 
TACATATCAA 
GGTTCTAATT 
TTTTCTTTAA 
TCACAAATGA 
GTGTGTCCAT 
GGACGATTAA 



CACTTACTGC 
GTTCAATAcT 
CTTTAGAAAC 
GAATTACGCA 
CTACTAAAGG 
CATCATGTCG 
TAAATCGACT 
TCATGTTAAA 
CATGATTATG 
ATTGTTTTAA 
TAAAATATTT 
ATGCTAAATT 
TGTTTAACAA 
CATTGATATA 
AAATATCGCC 
CTTTTGTCAG 
ATGTTCCGAA 
TTTTACGATA 
ACTTTTGTAA 
CAC GAGCGGG 
TTCTAGCTAA 
AATCTTTAGC 



CGTTCATAAG 
GTACCAAAGA 
TCTTTAGACA 
TTATCGTTCA 
TCTACTACAA 
AATTGCATGC 
TTTATCTTTA 



CACTAATTCC 
TGTCGGAGTT 
CTGGTGCGCA 
TCCATTCAGT 
TAATTGGTTC 
TACCCCTCCt 
TTTAAAATAT 



TGCTTCAGCA 
TTCAGTCGTT 
ACCTTTCGCG 
TCCTAATGTA 
AATTTCAAAC 
AATCAAAGTA 
AACTACGATT 
ATCCTCCTAT 
TACCGTTTCT 
TCCCTCAAAT 
TAAAATCTGT 
TGCAGTTACT 
TCCTATGCCA 
CTTCATAGAC 
TGTAAGgCAC 
TACAACTATC 
ATCTGTAGGC 
TTCAATTAAA 
ATCTTGTCCT 
CTTGGCACCA 
TACGCCTTTA 
TTCACTACTA 
TGTTGTTGTA 
ATCATCAACC 
TATTAATCCC 
AACCGCTACT 
TCCATTTTTT 
AAAAACCAAA 
TTTCAACATA 



CCTTTATTGC 258 0 

AAAATACCAA 2640 

ACTTCATT AC 27 00 

ATTACTGCAT 2760 

GCACCTGGCA 2820 

TCTTTTG CAC 28 8 0 

GCAACTTTCA 294 0 

ATTAAATGAC 3 0 0 0 

GGTACGATAA 3 060 

TTACTTGGAT 3120 

GCAGCAATAT 3180 

GTATCATATC 3240 

CGACCTTCTT 33 00 

GATTCAAGTT 3360 

GCAGAATGTA 3420 

TCTTCATCTG 34 80 

ATTTTCACTT 354 0 

TCATCAATCG 3600 

TTCGCCATCG 36 60 

GTAAGTTTAG 3720 

TCTTGTGCTA 3780 

GGATCAATG A 3840 

TCTACATGAT 3900 

ATTTGTACCA 3960 

CtTGCTTCTT 4020 

AAATCACCTT 4080 

AAAGC CATTA 414 0 

TGCTCTTAAT 4200 

TTTAAACAAA 4260 
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CTCGTTTCTG 


GAATAAGATG 


AATGTCAAAA 


CTGTTATCAT 


GCTTATCAAA 


TACCGTTAGA 


4380 




CTAACACCAT 


CCACAGTAAT 


AGACCCTTGC 


TTAACTAACT 


GATTATTAAT 


ATGTTGGCTA 


4440 


5 


CATTGAATCG 


TAATAATTTT 


TGCATTGGCT 


GTTTCATTTA 


•rrrrixsAAAC 


TGTTCCTAGT 


4500 




TCATCTACAT 


GACCGAGGAC 


AAAATGTCCA 


CCAAACCTAC 


CGTTACCACT 


CATGGCACGC 


4560 


10 


TCTAAATTTA 


CTTCTGATTG 


TCGCTTAACA 


TCTGCTAAAT 


AGGTTTTATT 


TTCAGTGCCT 


4620 


TTAATTACTT 


GAACAGTAAA 


AGATGTCTGA 


TTAAAATCAA 


TCACTGTTAA 


ACATGCACCA 


4680 




TTAACACTGA 


TGGAATCACC 


AATATGCATA 


TCTGCCGTAA 


TCTTATGTGC 


TTCAATTTCA 


4740 


IS 


ATCGTCCTGA 


CTGATTGACG 


AATTTGAACA 


CTTTTAACGA 


CACCTATTTC 


TTCAACGATG 


4800 




CCAGTAAACA 


TGCATCATCA 


CTTCTTTCGT 


AAAGTTAATT 


TAACATTTTG 


ATTTAATAAC 


4860 




TCGGAATGAA 


CAATTTCAAA 


TTGGTTCGCA 


TCTGGTATCT 


CAATCACATC 


ATTTGTTTGA 


4920 


20 


TAAAATTGAT 


AATTTCCAGA 


TCCGCCAATT 


AATTTCGGGG 


CATAATAGAG 


AATAAATTCA 


4980 




TCTATATAAT 


TAGATTGGAG 


AAATTCTGAA 


GTAGTGGTTG 


GACCTGCCTC 


GACTAGCAAA 


5040 




GTTCCAACTC 


CTCTTTTATA 


TAAATTGTGA 


AGAATTGTTG 


TTAAATCGCA 


AGACTTCAAG 


5100 


25 


TAAATAATTT 


CAATATGTGT 


TTGATTGGTT 


GTT AAATTTG 


GATTTTCAGT 


ATATATCCAA 


5160 




ATTGGTGTTG 


ATTCATCTTG 


AT AAATTTG C 


TGATTAAAAT 


GAATATTCCC 


AGACTTAGAC 


5220 




AATATTACTT 


TTATAGGGTT 


TTTTC CATCT 


TGAATACGTG 


TAGTATATTG 


TGGATCATCT 


5280 


30 


AATTCAACTG 


TACGTCTTCC 


AGTTAACACT 


GCGTCGTGTC 


GATGTCTTAA 


CTTATAGACA 


5340 




TCTTGTTTAA 


CCTCTTTGTT 


AGTAATCCAT 


TGACTTTGTC 


CATTATCATT 


CGCTTGTTTA 


5400 


35 


CCATCTAAAC 


TTGCAGATAC 


TTTCACTGTA 


ATTTGTGGCA 


GTTGCTTTGC 


TTTTGCTTTA 


5460 


AAAAAGTCTT 


GGTATAATTG 


TGATGCCCGT 


TCATCATCAA 


CGCATTCAAC 


CTCAATACCG 


5520 




TGAGCCCGTA 


ACGTCTCATC 


ACCATGTGTG 


TCTAACGAAT 


TGTCTTTTGT 


TGCGTATACT 


5580 


40 


ACTTTTGCTA 


TCTTACAATC 


AATTATTTTG 


TTAACACAGG GTGGTGTTGA 


ACCAAAATGA 


5640 




CTACATGGCT 


CTAACGTAAT 


ATAAATCGTC 


GCACCTTCAG 


CATTTTGTTG 


TGCCATATCA 


5700 




AGTGCTTGAA 


CCTCCGCATG 


CTTGTCACCT 


TTTCTCAAGT 


GTGCACCAAT 


ACCAACAATC 


5760 


45 


CTACCTTCTT 


TAACTACAAC 


AGCGCCAACG 


GGTGGATTAA 


cacctctitg 


ACCTTGTACC 


5820 




ATATTTGCAA 


GTTGAATCGC 


ATAATCCATA 


AATTGACTCA 


AATGATCACC 


TCTATAAACA 


5880 




AAAATCCTCA 


CATCATGAAT 


TAAGATGCAA 


GGAGaAAAAT 


TTATCGTTAA 


ATAAGCCTAT 


5940 


50 


TTGTACACAT 


TTTTACAAAT 


ACGCTACATT 


ATCTTTGTCG 


ATAATTAACA 


TTCTTTCTCC 


6000 




CATCCAGACT 


TTAACTGTCG 


GCTCTAGAAT 


CTCACTAGAT 


CAGCCACTAA 


TATGAAACAT 


6060 
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TTaTATATGA AATTGTTATA GATTATTTGA GTACGTAGTA TGTCAACTAC ATTTAAAATG 
ATACTATATG TTTTCTGAAA AAACAATTAA TGACGGTTTT AATTTAATAT AATCTGAGTA 
5 CTATAGGCAT CTCATTGATA TGATTCTTAC TAACAGACAT TAAAATCAAA CCTTCAATTC 

GTCTCTATAG AGCGTTCTCT TTATTATCTT CTAGTTACAA ATTATTGATT GtCACtGCGC 
TGTTGTTGCT CATTCGATTC TAAAGCATCA TATAATTGAG ATACTGTATG CGCAACTTCT 
TCTACAATCA TTTTCACACC GTTTCGTAGT TTATTAACAC CGTTTGTCAT TTGACCTATC 
GCAATCATAT TTGTTAATGT TCCAAACCTT GGACTAATAA CTTGATTGGT TTCCGGAATG 
r£ ATTTGTATGC CTCCCATTGG GTGTGCTTGT ACAATTTGTC TATTTTCAAG ATTTCTAATT 

AATTG AT CAT CTTGATCCAA TTCATTTAAA TGACTTTTTG CACCTGTCGC GTTAATGACA 
ACATTATATA TGTCTACTGA TTCTTGGTTT TTGTATGAAA AATAATACAA CTTGCCATaC 
20 ATGTTCACAT CTTCTAAATC TTTTTTCAAA ATTAAAGACT TATTTTCTAT TAATTCAATA 

ATTAGTTCAG CAGTTCTTGG AGGCATTGGA TTTGAATTTA ATTGAATCAT CTTTGAGTAT 
TTTTGATTAA ATTGATGTTG GTCTTCAATA CTTAAGCTAT TCCATATCCA ATTTAAATTC 
25 TCTTTCAAAT GTTCAATCAT ACTTTGGAAA ATGCCCaTTT CTGTTGGACG CGCTAAATCA 

TACTTCAAAT CTGCAATATG ATTTCCTGTA CGTCTATGTA CTAATTTTTT AAAATCAATG 
TCATATTCAG CACATTCTTT TAAAAATAAA GAAACTAAAG TATCAAGCGG TGCATTGCCG 
AAATGATGTT TTTTAATGTC ATTTAATTTG TCTTTAGTTA AGTACTTGAA TGTCACGTCT 
ATCATTGTAC CTCTTACACT TGGTAAATGA GCAGAACGAC TCGTCATAGT AATTGGTAAT 
TTTGGATGAT GAGCAGCAAC ATAACGGACA ACATCTAAAC TGGCAAGGCC TGTACCAATA 
ATCGCAATAT CGTCCAGTTC ATTTACTTCG TCTAACGTAT TATATGTTGG ATAAGGCGTA 
gcGATATATC CTTTTTTACC CTTTAAGTTA TATGGATCAT GGTAGGCAAA TGTACCACAT 
40 GTTAAAAATA CATAATCGTA CGCTTGCCAT GATTGTCCTG AATTTGTAGT ACATATGTAA 

TAAGTTAAAT TCGTTTCATC GATATTAGAXTTO "" 
TTAGTTGATA TATTTGGATA TTTTTTCGTG AACATAGATA AATAAGATTT CATATAATGT 
45 CCGAATACAA ATCTCGGTAA ATATGCAG 

(2) INFORMATION FOR SEQ ID NO: 143: 
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<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10320 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND ED NESS : double 

(D) TOPOLOGY: linear 
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<xi> SEQUENCE DESCRIPTION: SEQ ID NO: 143: 
nCTAGGTATT TTAAACCTAA TCTAGATAAA CTAGCTTCGT AAGCAGCTGC TACATTTTCA 
CGACCGAAAT CCTCAAAATA TAATTTTGAA GTAATAAATA AGTCTTCTCT AGCAATACCA 
GTTGACTCCA ATCCGGCACG AATGCCAGCA CCTACTTGTT CTTCATTCCC ATAAACTTTT 
GCGGTATCAA TACTACGATA TCCTTGTTCA ATGGCATACT TAACACTTTC CATGCAATTT 
TCATCATTTT CCACACGAAA TGTCCCTAAA CCAATTTGTG GCATCGTGTT TCCATTATAA 
AATGTTTTAA CCTCCATAAA TATCGCCTCA CCTTTTTGAT GTATTATACC CTGTTAT CAT 
AACAAATCTG AGTTGAATAC ATGAGAAAAA ACACTTAGAG CAATCAACCA CTAAAATTCT 
AGTAAT AT CT CTCAAATATT AATCAAATTG TAAAAGTAAT TCTGTTTAAT TTATGACAAA 
CTAAAAAAGC CGAAGTAACA ACATATAGTC ATCACTTCAG CCTAACATTT AATTGAATGA 
TTCAATTTTA TCCATCATTT GTTGTAAGTC TTCCACGTTG TATTGAATAC GACCATGGAA 
TACAAATTTG TTAAAGAACT CGTCTAATTG TTCAGCACCG ACAAGCACTT TGACAGCACT 
ATTTTGATTA TAATTTGAAA TCGTTACATC GCCTTCATTT TTAAGATTAA AGTATAAAAT 
TGAAGTTGGT GTATATTTGG CACCTAATTC TTTTTGTAAG TCTTCAGCCA ATTGTTTAAT 
CGCCTCAATT TGATCTGAAT AATTTACAAA TGATAATGAA CGTTTGTCAT CATTTTGATC 
CAT CACAAT A GTTTGCGGTC TAGATTTATC TAAATCCAAT GTATCAAATA CTTGTTCCAT 
TGGTGGTAAA TCTTTAAATT GACCGCCACT AATAC CATTA TAAACATGAC CTTTTAACAA 
TTGAGAATCA ATAATATAAA GACCAGTTCT TGTTAATACT AAATGACTAA TTCGTTCAAT 
ATTATTAAAG CCATCCTTTG GTAAAAAGAT ATTTG C CAT A ATGTGCATAT CTTCTGGTCG 
AATTCGTTTT TCTTTAACTA ATCTTTCACG AATAC CAATT AATCTCATGT CCGTTACATA 
TTCACTATGA TTTTTCGAGA ACAATTTTAA TGCGTCAATC TCACGATCTT TTGTACTAAC 
CATGTGATTA TAATCTTCTT GTTGTTTTGT AATTGTCTTT TTATTTTGAA TACGCTCTTT 
CTCTAAAGCT TCTTCATGAG ACTTTTTAAT GTTTTGTTCT TGTTGTTCAT ACTTTTCTTC 
TGTTTGTCGC TTAACTTTTT TCTTACTACC TAAGGCAACT AAAAAAAGGA CAAAAAAGAT 
TAATGCAATG AgCTACTGCA ATAATGAGTC CAATGACTAT CGGTGAAGAT AAATC CATCA 
CAACAACGCT CCTTTTTAAT ATATGAATAA CTTTAATTAT AATAGAaAAG CTAAAGATTT 
TCGATACATA TTATCATTTA TATACCGAAA ATCTTTTATT TAGCTATATT CAATTCATCT 
TATTATTTTA CTGCGTCTTT TAATTCTTCC ACTTTGTCTA ATTTTTCCCA TGGGAATAAG 
ACATCTGTAC GTCCAAAATG ACCATAAGCA GCAGTTTGTT TGTAAATCGG TTGTTTCAAA 
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AGTTGCCCTT CAGAAACTTT ACCTGTTCCA AATGTATCAA TTGCAATTGA CACTGGTTCT 
GCAACACCAA TCGCATATGC CAATTGTACT TCACATTGAT CTGCTAAACC TGCTGCAACA 
ATATTTTTAG CCACATAACG TGCAGCGTAT GCAGCTGAAC GGTCTACTTT TGTAGGATCC 
TTACCACTGA AGCATCCGCC AC CATGACGT GCATAGCCAC CGTACGTATC AACAATGATT 
TTACGTCCTG TTAATCCTGC ATCACCTTGA GGTCCACCGA TTACAAAGCG TCCTGTAGGA 
TTGATGTAGA ATTTAGTTTG TTCATTAATC AAGTTTTCTG GAACAGTTGG ATAAATGACA 
TGTGCTTTAA TGTCTTCTTG AATTTGTTCA AGTGTCACAT CCTCAGCATG TTGTGTTGAT 
ACGACAATCG TATCAATACG TACTGGGTTA TCATTTTCAT CATATTCAAC AGTGACCTGA 
ACTTTAC CGT CTGGTCGTAA ATAATTTAAC GTACCATCTT TACGCACATC TGATAAACGT 
TTTGCCAATT GATGTGATAA ATAAATTGCT AGAGGGATAT ACGTCTCTGT TTCATTCGTT 
GCGTAACCAA ACATTAAACC TTGGTCACCT GCACCTGTTG CTTCAATTTC TTCTTCGCTA 
TCTTTATCAC GATACTCTAA TGCTTTATCC ACGCCTTGTG CAATGTCAGG TGATTGTTCA 
TCAATCGCAG TTAAAATTGC CATTGTTTCA TAATCATAAC CATATTTTGC TCTTGTGTAT 
CCAATTTCTT TAATTGTTTC TCTAACAACT TTCGGAATAT CAACATATGT TGTTGTAGAA 
ATTTCGCCGG CGATCAATGC CATACCTGTT GTAACAGTTG TTt CACAAGC TACACGTGCA 
TTTGGATCGT CTTTTAAAAT AGCATCTAAT ATTGCATCTG ACACTTGGTC AGCGATTTTA 
TCTGGGTGTC CTTCTGTAAC AG ACT CTG AA GTAAATAATC GTTTGTTATT TAACATAGTT 
TGCTCCTTTA AATTTATATT ACGAAAATTC TCTCTCTGTG AGCTAAATAA AAAAGACCTT 
CTAACTATTA ATATAGAGAG AAGGC CTAAT ACGTCCATTC GCTCTTATCG TTCAGACCTA 
TTTGTCTGCA AAcGGTTTGG CACCTTTCTT TTATAAAAAA GAGGTTGCTG GGTTTCATTG 
GGTCCATGTC CCTCCACCAC TCAGGATAAG AGAATCCGTT AAAAATAATA GTACCTAATT 
AATGAATTAA TGTCAATTTT TCACAAATAA ATTTACAGTA AAATATTGTA GATTAATTAT 
GTTAATGTGT TATACTAATT AAATGTAAAG GCTTACATTT AAATTATCGC TTTGGAGGGA 
TTTAGGATGT CAGTAGACAC ATACACTGAA ACAACTAAAA TTGACAAATT ACTGAAAAAA 
CCAACGTCAC ATTTTCAACT TTCGACGACA CAACTTTATA ATAAAATCTT AGACAATAAC 
GAAGGGGTAT TAACAGAACT TGGTGCTGTT AATGCAAGTA CTGGAAAATA TACTGGTCGT 
TCGCCTAAAG ACAAATTTTT TGTCTCTGAA CCTTCATATA GAGATAACAT TGATTGGGGA 
GAAATTAATC AACCTATCGA TGAAGAAACT TTCTTGAAGT TATACCATAA AGTACTAGAC 
TATTTAGATA AAAAAGATGA ACTATACGTA TTTAAAgGcT ACGCTGGTAG CGATAAAGAT 
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ATGTTTATTA GACCTGAATC AAAAGAAGAA GCTACAAAGA TTAAACCTAA CTTCACTATC ~ 3 600 

GTTTCTGCAC CACATTTTAA AGCAGATCCA GAAGTTGATG GTACTAAATC TGAAACCTTT 3660 

5 GTCATTATTT CATTTAAACA CAAAGTCATT TTAATCGGCG GTACTGAATA CGCTGGTGAA 3720 

ATGAAAAAAG GTATCTTCTC TGTAATGAAT TATCTCTTAC CGATGCAAGA TATTATGAGC 3 780 

ATGCATTGCT CAGCAAACGT TGGTGAAAAA GGCGATGTTG CATTATTCTT TGGTCTATCT 3 84 0 

W GGCACTGGTA AAACAACCTT ATCGGCTGAC CCACACCGTA AACTAAT CGG TGATGATGAA 3 900 

CACGG CTGGA ATAAAAACGG GGTCTTTAAT ATCGAAGGTG GCTGCTATGC AAAAGCAATT 3 960 

AATCTTTCCA AAGAAAAAGA ACCACAGATT TTTGACGCAA TCAAATATGG TGCAATTTTA 4 020 

75 

GAGAACACTG TAGTTGCAGA AGATGGTTCA GTGGACTTTG AAGACAATCG TTATACAGAA 4 080 

AACACGCGTG CCGCTTATCC AATTAATCAC ATTGACAATA TTGTAGTACC ATCTAAAGCA 414 a 

2Q GCACATCCAA ATACAATTAT TTTCTTAACT GCGGATGCAT TTGGTGTTAT TCCACCGATT 4 200 

TCAAAGTTAA ATAAAGACCA AGCAATGTAT CATTTCTTGA GTGGTTTCAC TTCTAAATTA 4260 

GCTGGTACAa GCGTGGTGTG ACAGAACCTG AACCATCATT CTCAACATGT TTCGGAGCAC 4 320 

25 CGTTCTTCCC GTTACACCCT ACTGTTTACG CTGATCTATT AGGTGAACTT ATCGATTTAC 4 380 

ATGATGTTGA TGTTTATCTT GTTAATACTG GATGGACTGG CGGAAAATAT GGTGTAGGAC 444 0 

GTAGAAT CAG CTTACATTAC ACACGTCAAA TGGTAAACCA AGCGATTTCT GGCAAATTGA 4 500 

30 AAAATGCAGA ATATACAAAA GATAGTACGT TTGGTTTAAG CATTCCTGTA GAAATTGAAG 4 560 

ATGTACCGAA AACAATTTTA AATCCAATTA ATGCTTGGAG CGACAAAGAG AAATATAAAG 4 620 

CACAAGCAGA AGATTTAATT CAACGTTTTG AAAAGAACTT CGAAAAATTT GGTGAAAAAG 4 680 

35 

TTGAACATAT TGCTGAAAAA GGTAGCTTCA ACAAATAAAT TTGAATACTA AATCaAAACC 4740 

ACCdGTGTGA ACGGGTGGTT TGTTCTGCGG CTATAAGCCT TCCTTACTGG CCAGCCCTAA 4 800 

AAGGGCACTG ACAAGTCAGC CAACTGCACT ACTATTCGAG CAACCCTAAA GGGTTACTCT 4 860 

40 

TTTTTCTTTC TTTTTTTATT TTTCTCTCCA GTGAAAGGAT CTAAATATTC TTCCATTGAG 4 920 

ATTTGGTCTG CAACGATATC CTCTTGTAAT TGATTACGAA TATAATTTTC AATCACTTTT 4 980 

45 TTATTTCTAC CTACTGTATC GACATAAAAT CCTTTACACC AAAACTTTCT ATTTCCATAT 504 0 

CTATACTTTA AGTTAGCATG TCTATCAAAT ATCATTAAAC TACTTTTTCC TTTTAAATAG 5100 

CCAACAAATG ATGATACCCC AAGTTTGGGT GGTATACTAA CTAACATATG GATATGATCT 5160 

SO TTACATGCCT CTGCTTCAAT TATCTCTACA CCTTTTCTTT CACATAATTG ACGCAATATA 5220 

ATCCCTATAT CTTTTTTTAT TTTTCCATAT ATCACTTGTC TTCTGTATTT AGGTGCAAAG 5280 
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AAATAGCATC TCCTCGTGTT GATTATTTTG GTTGGCTGAC CAATATTTAT TCTAGCACGT 54 00 

AGAGATG CAT TTTTTGTGAC AATGGTAGAA CCTTTTCtGa ACCATACGCA TAGCGTATGG 5460 

TTTTCTTTTT ACAATTAAAG AGCCAACCGT TGTTATAGTC TAACAATGGT TGGCTCCTCT 5520 

TATTTTATGT GCTAAAAATT TATAGGCAAT TTTATTACAA CAATGTACAT TTAAGGTGAC 5 580 

CTTCATGCCA AAATCGCATC ACTCATTTAA TGGAAGCAGC ACGTCTTCAT AT AAAGTAC C 564 0 

GATCC CTAAT TCAACGCATG TAGTACCACA TCTTCAAAGC TTGATAGTTC CCATGCGCAC 5700 

AC CACGTTTC ATACTAGCTA TGCGACTCAA CTTGGTTCAT AAACTCTTTA ATATAAGTCA 5760 

ATGTTTCAAC CATCGCTGGT GGTCTTGGCA CATGTCCTTC TGCCATTTGA TAAAATGTTT 5820 

CATGCGTGGC ACCTTTTAAC TCTAGTTGGT CCGCTAAATA ATACGCATGA TGAATACCAA 5880 

CTTGCTGGTC TTTCCCTCCA TGTACAATTA ATATTGGCGG ACTGTTTTCA TTAATGTTTG 594 0 

20 GAATCGCTTG GCGTGCCTCA TATGCCGCTC GATCTTTTTT CGGATGACCA ATCATTCTTC 6000 

GTAGCATGCC TCTTAAATCG ACACGTTCTT CATACATTAA ATCAATATCT GAGACACCAC 6 060 

CCCAGATTGT ATAACTTGTT ACTGGTAAGT CTTGAAATGT CAACAATCCT TGTAAACCAC 6120 

2S CTCGCGAAAA ACCAACCATG TGGATAAATG CATGTGGATA TTTATCATGT AGCAACCTTA 6180 

ATAATTGCGT CACATCATTT AAATCGCCAC GGTAAAATTC GTCTTTGCCT TCACTCCCAT 624 0 

TGTTACCTCG GTAGTATGGC CCAATCACTA AAGTTTGACT ATCTGAAAAT TGCATTAATC 63 00 

TACCTGCGCG CACACGTCCT ACTTGACCTT TGCCACCTCG CAAATAAACT ACAATGCGAT 6 360 

TTACTTCATG ATGTGGTGTC ATCATTAAAG CTTTTACTTG TAAGTCATCT GACAAATATG 6420 

TAATTTCTTC GAATTGATGC GTAAAATATT CAATTGGCAT TCGTTTACGT TTGATAAAAC 64 80 

CCAAGTGATT GCACCCTCTC TACGCATTTT AAAATGGTAC TATCTTGCAG TAAGAAACTC 654 0 

CGTTGTGCGA GTTCAATATC ATTGATACAG TTAAACAACA CTGGCCCTGC TGTTTCTAAA 6600 

) 

4Q TAATCGTTCT TGCTTACCAA TGATTCAACT TCGATAAAAT ATACATCTTT TACAAAATCA 6660 
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GTTTGATCAT GTGTTTCAAT GGTATATTGT GCTATGTAAT AAATATTTTT AACTTTGGCG 6720 

CCTGTTTCTT CATATAATTC aCGTGTAACT GCTTCAGCAC TACTTTCCCC GCGTTCCCTT 6780 

4S TTACCACCAG GAAATTCAAT CCCCCGTAAA TTATGTTTGG TAAAAAGCAA TTGATTTTTA 6 84 0 

AACGTTGGAA TAGCTAGCAC ATGATTGCCA TCTGCTATCT CATTATCCTT TTTAAATGTC 6900 

AAATTAACTT GACGATTATC TTTATCCCTA AACTTCACGC GCATCACATC CCTACATTGT 6960 

50 ATGTTAATAT AATAGTTAAT TACTATCGTT GGAGGCATTA ATTATGAAAA AGATATTCTT 7020 

GGCGATGATT CATTTTTATC AACGTTTCAT TTCGCCACTC ACTCCACCAA CTTGTCGTTT 7080 

55 



BNSOOCIO: <EP 078651 9 A2J_> 



748 



CCTTTATTTA GGTATCCGTC GTATTTTAAA 
CCCTGTTCCG TTAAAAAAAG ACAAGTCAGC 
ATATGGTTGT AATTGAGTTA TATCCACTAA 
TAATATGCCT GAATGCGCCA CCACATCTTG 
TCCTGGATAA TCACCTTTAC GAG CAAG CAT 
GTACATGCCG CCAATAACCA CTTTTGCACC 
CACTTTATCA ATGCCAC CTA GACGAAATGG 
TTCTATCAAA TTAATTATGT C CaACAACG A 
TATTGTTCCA TCCGCTACTT CATCAAG CAT 
AAGAACCTGT TCACGCGCTA ATAACTGTAA 
ATTTGCATCT ATAACCAATT GAAAGTGAAA 
CATGATTTGA GGCGTCCATT TTAATTTAAT 
TAGTTGTTTA TTTGATAAGC CGCTCGcTGT 
TACATGAAAC ATTTGATACA ATGCCATGAC 
CAATGAATCT ACTAATTTTA GTGCTGCTTC 
TTCGAACCAT TGCTCAATTA C A T G TTTCAC 
TGTTTGAAAA GCGTTACATT CCCCGAAATA 
AAACAAACAA TCACGATGCG TTAAAGTGAC 
CTCACTATAT TTATAAAAAT GCAAAGCTGT 
TATTTCTTTG TAATTTACCT GTTGATGTAT 
TCGGTACTTT AT ATTTCG CT AAATGTTGTG 
TGTCACTTTC ACTGACAAAA TATAATTTAG 
CTACACATAC TGCGTCACTG ATACCTGGAA 
GATAAATATT TTCACCGCCA CTAATAATTA 
AACCTTCATG ATCTATTTCA GCAATGTCAC 
CCGTTAAATC TGTTGGATAC AAATATACAT 
CTCCATGACC TTCTTTATTA GGATTTTTAA 
CTACAGTGTC AGGACGTGCA TGCAACATTT 
TCTCAGTCAT ACCAAATGAA TTATAAATTG 
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ATGTCATCCG CTTCATAAAG GCGGCTTTGA 
AAGCAAGCAT TCACATAAAC ATAACCATTA 
AGGGGGGCGA AATTCGAGTC GCCCCTCTTT 
TTCAAAATAA TAACCTG CTG GTGTAACATC 
CGCTGTAAAA TAGCGGCTTA AACCATATTC 
ATGACTTTTC AAAGTATCAA TTGCCGTTTG 
TTTTAATACA ACAACTTTCA CATTGTATAA 
TGTTGCCTTT TCATCAAGGG CTATTGGAGG 
GGAGATATCT TTAAATGGCT CTTCGATATA 
CTGTGTGAAA TCTTGACGAT CCAAGGACTC 
GTCTAATTCC CGTAACACTC TAATTTGATG 
TCTGGTCGGC TTTGTTGCTT TTAATGACTC 
CGCTCCATAT GCTACTGAAA ATGAAGGCAG 
AATAGTTGCC CTTGCAGCAG GCGTATTTTC 
ATACGTTTCA AATGATTTAT TTCTATTATC 
TGAGGCAATT GTTTCATGAT CATACCAATC 
TGCATTTC CT TTGTCATCAA TCAATTCGAT 
TTTCGGTGTT ACAATTTGTG ACTTAAATGG 
CAACTTCATC AAATCATCCT CTATACAACT 
AAGGTAAAGT ATCAACCTTT TCAAAGTGTT 
AT AAAT ATG C AATCAATTGT GCCTTTGAAA 
GCACTTGGCC CCAAGTATCA TCAGGATGCC 
ATTGCtTCGC TACCGTTTCA ATTTGATATG 
AATCTTTACG TCGGTCATAA ATCATGACAT 
C CGT ATT AAA ATAACCATTT TCAAACGTAC 
TCATCACATT GGCGCCTTTA ATCATTAATT 
TTTTTACGTC AACATTGGCA CTTGGCATCC 
CCGGTGTTGC TGTTAAAAAT TGCGAACATG 
G CAGGTT AT A TTGTAATGCC GTCTCTATCA 
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25 



AACCTTGTTG CATAAGCCAA TTTAAAGTTT GTGGCACAAG CGAAATGTGC GTGATTCGTT 9000 

CATTTTTAAT CATCGTTAAA ATTTGTTCGG CATTGAATTT ATCAACAATG CGCACAGTAA 90 60 

AACCTTCAAT AACAGCTCTT AAAAGTACAC TGAGACCCGA AATATGATAA ATCGGCAAGA 9120 

CAGATAGCCA ATTAGTGTCA CGATCAAATC CCAAGCTCTC TTTACATCCG ATTGCACTGG 9180 

CATAATGATT ACGAAACGTT TGTGGCACCG CTTTTTGAGG GCCCGTTGTC CCTGATGTAA 924 0 

ACATAATCGA TGCAATGTCA TCTAAATTAA ATGATGTATT TAATATGTTG GACGGCGACT 9300 

CTTTCGGCAC CACAGTTTCA TTCGATGTTT CATATTGGAT ACCCATTGTG TTGTCCAACA 9360 

AACTGTTCGT TGTAATATCC CTTCCAGCGA ATT CAATATC ATCCAGCGAT ACAATTTGAA 94 20 

ACCCTCGTAA TTCCAGTGGC AAGGTACAAA AAATCAATTG TACATCGATT GACTTCATCT 94 80 

GATTCGTCAT CTCATTAGGT GTCAACCTTG TATTAATCAT CGCAATTTCA ATATTTGCCA 954 0 

20 ACCAACATGC ATGTATTAAA ATGATCGATT GAATCGAATT ATCTATGTAT AGCCCAACAC 9600 

GAGATTGTTG ATAAGCCTTG AGTCTTTTAG CCAATAGACT CGCTTCACAG TATAAATTTT 9660 

GATAAGTATA AGATTCTTGA CCGTCTGTTA TCGCAATATG ATGTCCATTT TGTTGTGCTT 9720 

GTTTATATAA CCAAAAGTCC ATGCGTTATT CCTCCAAAAT CATTTACATT ATAATTATAA 9780 

CGATTTTATG ACATTCTAGC AGTGGTTATG TTTAAAAATA TAAAAAAGTA GACGAATTGA 984 0 

TGCATTGATA TGATTGTTAT AATGCTCAAT ACATATCGTT ATATCATTCG TCTACTATTA 9900 

TCAGTTATTT TTATTTAATT TTAGTGTCAT TCTGTCATTT TGATGTGGTG ATTTACCCAT 9960 

TGTTGCCACA TCATCTGCAA TGTCAATTGG TATACGGTTC ATGTCTTGTA ATGCACTTAA 10020 

ATGGAATACT TCATCATCTA AATTTTCAAT GAGATATACA TAATATGTTA CCTTGTCCTT 10080 

TTTATATTTT AACGTTTTCC AAAAGTCCGG CTTGCAATTC AATACATTAT C CGGAAT ATA 10140 

TTCAATAAAT AAGTAACGTT TGCTGCCTAC TTTGTCTATG AAATATTTTG CAGTGCCTTT 10200 

40 TTCTATACCT CTTATATGTG CATAGTCTGC TGAAAAGTAA ATACTACCTA TTGTTTCATT 10260 

ATGTTGTTGT ATTTCAAATC GTTGGCCTAC TATTTTATTA TTTGTGCTAC nGGGGACTTA 10320 
(2) INFORMATION FOR SEQ ID NO: 144: 

45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1477 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

so 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 144: 

SS 



30 



35 



750 

BNSOOaD: <EP 078651 9A2_I_> 



10 



IS 



EP0 786 519 A2 

GTGTGGATTG GATTTTAAAA TCACCCTCAT AAATACTGTC ATCAATATGA TAAGTTACAA 120 

TTTCAC CT AT TATTAAATCA GCCCCATCTA ATACATCTCC AAGCAATATC ATTTGCGmTA 180 

GTTTACATTC GAATCTCATT TTCGCATCTT TAATTCCTGG CGTCTTAATC GTTGTAGATG 240 

TTAAAAGTGA TAATTCTGTA CGACTCAACT CACTGTCACC ATATGCTAAC GGCGCTGCAG 300 

TCTCATTAAT ATCTTGAACA TTATCTTCGT CTGTAATATG CACAACAAAG TCTCCAGTCC 360 

GTTCTATATT TAATGCAGTA TCTTTTCTCT TACCTCCTGC ACGTTGAACT GCAATAGCAA 42 0 

TCATTGGCGG ATGATTATTA ACAATATTAA AAAAGCTAAA TGGTGCTGCA TTTACTGATG 4 80 
CATCTTGATT TAATGTTGTA ACAAAAGCTA TAGGTCGTGG AATAATTGAA CCAATTAATA . 540 

ATTTATAGTT TTCTCTAGCA GTTAATGATT GTGCATCAAA CGTATACATA ATACCTACCT 600 

CTTTTCTAAG TATATCTAGG TATTTCTCCG ATTTTGGTTA ATTTAAACAT CTATTCTCCT 660 

20 CTGAAAATCA CTTGTATTTA TTTAGCAAAT CTTTTGAAAT ATGACACATA TGCATATCTT 720 

CTGGATATTT TTCTAAATGT TGCTGATGTT CTTCAGCACT TTTAATGTAG TTAGACAGCG 780 

GTAAGACTTC CACTGCAATT TGATCTCTGT CTTTACGTCG TTCAATGAAC TGACGCGCTT 84 0 

25 CAATTAAGTG GTCATCTACA CAACTATATA AACCCGTTCG ATACTTTTGT CCAATATCAT 900 

TTCCTTGTTG ATTCACACTG TAAGGATCAA TGATTTCAAA TAAATAATTC ATAATGTCTG 960 

TAATTGTTAA CATACGATCA TCGAAATGAA GTTTGACACA TTCAGCATAA CCATCATACG 1020 

GACCGTCTAA TTTAGAGCTT CTTCCATTTG CTCTTCCTGC TTCTGTATGT ATAATTCCAG 1080 

GTATTGTTGC AAAAAATGCT TCAACACCCC AT AAA CATC C TCCTGCTACA TAAACAACTG 114 0 

CCATATTTAC ACCTCATCAT CCTTTTTTAT ATTTTTAACA AGGTTATACC ATTTAAT AC C 1200 

GCCATGACAT GATTCTGATA CACCTTCATT ACGATACCCA TATTTTTCAT AAAATGAAAT 1260 

TAATGATTCT CGACATGTTA ACGTTACACC ATGTCGATGA TGATTCTTAG CAAGAGTTTC 1320 

AAAATAGTTT AGTAAGCGAC CTGCAATACC CTGACCTTGA TAATTTGGTG CTACAACAAG 13 80 

ACCTAACACA CTAATAT AG C CACCTTCACT ATTATTTGTG GAGACATTTT TAAATAAATC 144 0 

ATCGCTAATG TAACGCTCTT TTATGACTGG ACCGTTG 14 77 
45 (2) INFORMATION FOR SEQ ID NO: 14 5: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3976 base pairs 

(B) TYPE: nucleic acid 
so (C) STRANDEDNESS ; double 

(D) TOPOLOGY: linear 
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AGGTGATTAT 


1 CCTAAAAATG 


CTCATGAGGT 


CGCTATTAAT 


GATAAGTTAG 


CT*GCAGAf*AA 


60 




CATTAGAGTC 


GGGGATAGAT 


TACATTTTAA AAATAATTCA ACTAGTTATA 


VJJaXJ ill w X VJVJ 


120 


5 


TATTTTAAAC 


GACACAATGT 


ATGCGCATAG 


TTCCATTGTG 


CTATTGAACG 


ATAACGGATT 


i a ft 
180 




TAATGCATTG 


AATAAGGTTA 


ATACGGCATT 


TTATCCAGTG 


AAAAATTTAA 


CACAACAAOA 


^4 0 


10 


ACGTGATGAG 


CTTAATAAAA 


TAAATGACGT 


TCAAGTTGTG 


AGTGAAAAAG 


n-x x i/w\^/vjO 


T ft ft 

J 00 


TAATATTGCG 


AGTTATCAAG 


CAGAGCAAGC 


ACCGTTAAAT 


ATGATGATTG 


X x T\\J XXX O X x 


*3 ^ ft 




TGCTATTACA 


GCAATCGTTC 


TAAGTGCATT 


TTTGTATGTT 


ATGACGATTC 


AAA A A ATA TP 


A ""> ft 

4<S 0 


15 


ACAAATTGGC 


ATTTTGAAAG 


CAATTGGTAT 


TAAGACAAGA 


CATTTATTGA 


w X \J\**\J x Indjl 


480 




TTTACAAATT 


TTAACACTAA 


CAATAATTGG 


GGTAGGTATT 


GCTGTGATCA 


TP* &t& nT ta cy 


54 0 




ACTATCATTT 


ATGATGCCGG 


TAACGATGCC 


TTTTTACTTA 


ACAACGCAAA 


nlnl 1 1 1A1 1 


600 


20 


AATGGTGGGG 


ATATTTATAT 


TAGTAGCGAT 


TTTAGGTGCC 


TCACTATCAT 


TTATPi A ATT 


c c r\ 
o b 0 




ATTTAAAGTG 


GATCCTATCG 


AAGCAATTGG 


AGGTGCAGAA 


TAATGGCATT 




"i ft 

720 




GATATCGTCA 


AAAATTTCGG 


AGAAGGTTTG 


TCTGAAACAA 


AAGTTTTAAA 


Af3f2T* A XT A A T* 


Ton 
/SO 


25 


TTTGAAGTGG 


AACAAGGGGA 


ATTTGTCATT 


TTAAATGGTG 


CCTCTGGTTC 


luyVjn/UviLn 


a v* ft 
t>4 0 




ACATTGCTAA 


CGATATTAGG 


CGGATTGTTA 


AGTCAAACGA 


GTGGTACAGT 


CVTTTAP& & *P 


Q ft ft 

90 0 


30 


GATGCGCCAT 


TGTTTGATAA 


ACAGCATCGT 


CCTAGTGATT 


TACGATTGGA 


A^ATATTYtfVr 


Q C ft 

!?o 0 


TTTATTrrrc 


AATCTTCACA 


TTTAGTTCCT 


TATTTAAAAG 


TGATAGAGCA 


ATTYZ A C A PTT 


T ft. *5 ft 




GTAGGTCAAG 


AAGCGGGAAT 


GACCAAACAA 


CAAAGTTCAA 


CAAGAGCAAT 


AVJUlt i 1 i lVj 


1 ft Q ft 


35 


AAAAATATTG 


GTTTAGAAGA 


TCGCTTGAAT 


GTATATCCGC 


ATCAGTTATC 


TGGCGGTGAA 


1140 


AAGCAACGTG 


TTG CGATTAT 


GAGAGCATTT 


ATGAATAATC 


CGAAAATCAT 


TTTAGTAGAT 


X ^ U VJ 




GAGCCCACAG 


CAAGTTTAGA 


TGCCGATAGA 


GCAAGAAAAG 


TTGTTGAGAT 


GATACGTCAA 


l*OU 


40 


CAAATTAAAG AACAACAAAT 


GATTGGTATT 


ATGATTACAC 


ACGATCGAAG 


•nx x^%x x xunn 


X J A u 




TATGCAGATC 


GAGTGATTGA 


ATTAGAAGAT 


GGCAAAATAA 


CTGATTAGTG 


GCTTGTAAAG 


X J D V 




ACGCTAAATG 


TTAATGATTT 


Aft«Mw\ 1 1 


Ho Inl nAAAo 




GAATACGATT 


X ** *s \J 


45 


TGGGTTTACA 


AAAAACAGGC 


TGGGACATTA 


AGTTCTTAGG 


CAATGTAAAA 


A JxCZ f""*TY5 A T*PT* 


1DUU 




CTATTAATTA 


TTTGATAGAA 


ATCAGCTTTT 


TTGATATGTA 


TTTTATAATG 


TACAGCTCGT 


1560 




TGCATTCATA 


TAGCTTGAAG 


TCACGTTTAA 


AACCATATCT 


ATCATTATGG 


TATGCATATC 


1620 


SO 


TTTTAAAACC 


TATTCTTTTG 


TTATTAGGAC 


ATATAAATTC 


ATCATTAAGT 


TCGTCATATT 


1680 




TCCAATTTTG 


AGTGTTAAAA 


ATGTCACTTT 


TAAACTTTCT 


AGTTTTATCT 


TTAATAAACA 


1740 
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CACTATCATA 


ACATGCATCA 


GCTACAATAT 


ACTC CGGTAA 


ATAACCGAAG 


nTATTTTgAA 


1860 




TCATTGTTAA 


AAATGGAATT 


AAAGTTCTAG 


TATCTGTTGG 


GTTTTGAAAT 


AGGTCATAGG 


1920 


5 


ATAAAACAAA 


TTGAGAATTT 


GTCGCTATTT 


GTAAATTGTA 


TCCTGGCTTA 


AGTTGGCCAA 


1980 




AGTGTCTTAT 


rrrriTAAAG 


TATTTAAAAG 


TAAAATTACA 


TGTTAATACG 


TAGTATTAAT 


2040 




GGCGAGACTC 


CTGAGGGAGC 


AGTGCCAGTC 


GAAGaCAGGG 


GCCCCAACAC 


AGAArcTGAC 


2100 


10 


ATATAGTCAG 


CTTACAACAA 


TGTGC CGGTT 


GGGGTGGCTG 


AGACGGCACC 


CTAGGAAGGG 


2160 




ACCCGTCATC 


AAAAATTCTA 


TTTATAGAAT 


TTTACAGTAA 


TGTGCCAGAT 


GGGCATAGCG 


2220 


15 


AAgcCATTCA ATACGAAGTA TTGTATAAAT 


AGAGAACAGC 


AGTAAGATAT 


TTTCTAATTG 


2280 


AAAATTATTT 


TACTGCTGTT 


ttttttaggg 


ATTAATGTCC 


CAGACTCTTT 


AGTTTATTTA 


2340 




TTTTCAATAT 


AACAATTGTC 


TAATCAAGGA 


TTAACGAATA 


TTTAAAGATA 


GTTTGACGCA 


2400 


20 


ATATTAGAAA 


CAACCTATAA 


TAATAGTTTG 


TTTGTGGATT 


AACTATTATA 


AATAAAAGCG 


2460 




GCGTAAAGAC 


ATATAAACCA 


ACTACTTGAA 


CAATATAACG 


TTAATAACAA 


TCTATACTGA 


2520 




TACATTACGC 


CTAGATAATC 


TTTGATGAGC 


ACATGTAAGA 


AAAAGTGATA 


TGGTGTATGA 


2580 


25 


CTTCCGACAC 


CATCGATAGA 


TAAACCTAAT 


TTTTGGGCTA 


GTCGTAAGGC 


GCGCAATACA 


2640 




TGAAACTGAC 


TTGTtACACA 


AACAATTTTA 


ACTGCTTCAT 


GATACAAATT 


GTTGATGATT 


2700 




TGTTTAGAAT 


ATAAAAAGTT 


TGTGTATGTA 


TTTATAGAGT 


GAGATTCCAT 


TAGTATATCT 


2760 


30 


GTTTTATCAA 


CACCATGTGC 


AATCAAATAA 


CGTTGCATAG 


CTAAAGCTTC 


AGAAATTGGT 


2820 




TCGTCTGGTC 


CTTGTCCGCC 


AGATACAATG 


ATCTTTGTTG 


CTGATGCTTG 


TTG TTGATAG 


2880 


35 


ATATCAAGTG 


CACGATCTAA 


ACGCGCTGCA 


AGCATTGGTG 


TGACAAATTC 


GGTAAAAATA 


2940 


CCAGCACCTA 


ACACAATTAT 


GATATCAACT 


TCTTTGTTGT 


ATGATCTATG 


TCTATATGAT 


3000 




ACTOTCCAAA 


CGAGATAACA 


AATAAAGGTT 


AGTAACAGGG 


AAAGACATAA 


TATAGCTAAC . 


3060 


40 


CACATAGACA 


AACCTTTCAC 


AATAGGTGAC 


TGAATCGTAC 


TTATAAATAG 


AAGTGCTGAT 


3120 




GTGTAGAGTA 


CAAATTTATA 


TGAAAAAGAT 


AATAATTTTT 


TAATAAATAA 


GCGACTAGAA 


3180 




GTATGAGAAA 


ATAAATATCT 


ATGTTTGAAT 


AGCATGATAA 


TACTGATTAT 


TATAAATGTT 


3240 


45 


ACAAACATAG 


ACCAAGGGAA 


AGTATAGGTC 


ATGATGCTAT 


AGATGAGTGA 


CAAAAATATC 


3300 




GATATGACAA 


CTAAGATGTA 


GCATGTTAAA 


TTTAACGTCA 


GAGTATAGTT 


GAAAATTAAC 


3360 




GGACAAATAA 


CGATAAGTAT 


AAATATTAAT 


AATAAATTCA 


ATAACATACT 


GACACCTCGC 


3420 


SO 


TTATAATAAA 


TATTAAATAT 


AAATGTAGAT 


GATTTAATTT 


ATTAAAGCAA 


GGAGAAAGCA 


3480 




GCAACATGTA 


AATCTTAATT 


TGTTATATTA 


TATATGGGTC 


AATATTTTTG 


TGTTTTTTAG 


3540 
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TATGGTAAAA CATTTACAAG ACCATATTCA ATTTTTAGAG CAGTTTATAA ATAACGTTAA 
CGCATTAACT GCAAAAATGT TGAAAGATTT ACAAAATGAA TATGAAATTT CATTAGAGCA 
GTCTAACGTA TTAGGTATGT TAAATAAAGA ACCTTTGACA ATTAGTGAAA TCACGCAAAG 
ACAAGGTGTA AATAAGGCCG CAGTAAGCCG ACGAATTAAA AAGTTAATCG ATGCTTAATT 
AGTTAAGTTA GATAAACCAA ATTTAAATAT TGATCAACGT TTGAAATTCA TAACCTTAAC 
TGACAAAGGT AgAGCATATT TGAAAGAACG TAATGCGATT ATGACAGATA TTG CGCAAGA 
TATTACTAAT GATTTA 

(2) INFORMATION FOR SEQ ID NO: 146: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3346 base pairs 

(B) TYPE : nucleic acid 

( C } STRANDEDNESS : doubl e 
20 <D ) TOPOLOGY : 1 inear 



3660 
3720 
3780 
3840 
3900 
3960 
3976 



60 
120 
180 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 146: 
GCTACCTAGG CATTTAAGAG ATCAAAAAAT GTATGAATAT GAACGTTATT TTTATGAGCA 
AGAACTTAAT GGCGTTGATG aAGGGGAAAT TTTAAAGAAG TTAAAAGACC CACAAGATGT 
TGCAGCTGAA ACAAAAGCTA GAAGTGTTAT TGATTATGCT GAATCTAAAC CAACATTTGA 

AAATATTTCA AGAGCTGTTG CTGCTTCATT AAGTTTAGGC ATTCTATCTA TTTTTGTCAT 24 0 

CCTTATACCA GTATCTATAG TTGGATTATT TGTATTAGCA TTATTTTTAA TATCACTTTT 3 00 

GCTGCTGTTT TGTCCAATTA TTTTATTAGC ATCAG CAATA TCCAGAGGAA TTGTGGACTC 3 60 

AATTAGTAAT GTATTTTTTG CCATATCATA TTCAGGATTA GGATTAGTAT TTATCATTGT 42 0 

CATASTTAAG ATTTTAGAAT ACATTTATCG TTTAATCTTA AAATATTTAC TTTGGTATAT 4 80 

40 TAAAACTGTC AAAGGAAGCG TTAGAAAATG AAGAAATTCT TTTTTATTGG GCTTTTAGTG 54 0 

TTTGTTGTCT l^C^'AG^CCATf" ATTTGCSTTCa" G<^TCM/^AAACAAATAt" ~~~ - 6 00 

GGTACTAAAC AATATGATAA AACATTCAAA gACGATGCTT TTGACAATGT ATCTATAAAT 66 0 

45 TTGGATAGTA CAGAACTTCG TATAAAACGG GGGAATCAAT TTAGAGTTAA ATATGATGGT 72 0 

GACAATGATA TATTAATTAA TATAGTAGAT AAGACGTTGA AGATTAGTGA TAAAAGGTCT 78 0 

AAGACAAGAG GATATGCAAT TGATATGAAT CCTTTTCATG AGAATAAGAA AACGTTAACG 84 0 

ATTGAAATGC CTGATAAAAT GATTAAACGT TTAAATCTAT CATCTGGAGC AGGAAGTGTT 90 0 

AGAATCAGTG ATGTTGATTT AGAGAACACA AGTATTCAAA GCATTAACGG TGAAGTAGTT 96 0 
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AGTAAAAGTA 


ACATTAAAAA 


TAGCAATATT 


AAAGTTGTTA 


TTGGTACGCT 


ACAAATCGAC 


1080 




AAGAGTCAAA 


TTAAACAATC 


catattttta 


AACGATCATG 


GTGACATTGA 


ATTTAAAAAC 


1140 


5 


ATGCCATCAA 


AAGTAGATGC 


AAAAGCTTCT 


ACTAAACAAG 


GAGATATTCG 


TTTTAAGTAT 


1200 




GATAGTAAAC 


CTGAAGACAC 


TATACTAAAG 


CTAAATCCGG 


GAACGGGTGA 


TAGCGTAGTT 


1260 


10 


AAAAATAAAA 


CATTTACTAA 


TGG t AAAGTT 


GGGAAAAGCG 


ACAATGTTTT 


AGAATTTTAT 


1320 


ACGATTGATG 


GTAATATCAA 


AGTTGAATAA 


ATAAAGGATG 


TAAGCACCGA 


TATTAGGAAG 


1380 




CATAATTTCT 


CTAATATCGG 


TGTTATTTAT 


TTGTTGGCAA 


AAGTTAAGTC 


GGTATCTATA 


1440 


75 


TTGCCAGTAA AGTGAGTGAT 


ATTAAGGTCT 


TGAC CATCT A 


ACCATGATTT 


GAAATCTATT 


1500 




ATTTCTGGTG 


GCGCATTTTC 


TCCCAATGTA 


AAATATGCAG 


TTAATGTTTC 


AGGTTGATAC 


1560 




ATTGATGTAT 


GGATGGTGCC 


AGACCAGCTT 


TTGAATAGTT 


TACTGTAAAT 


TTCATACTGA 


1620 


20 


GGATTATTGA 


ATAACTTAAA 


TGCTGTAGTC 


ATATCTAAAT 


TATCATTAGT 


TTGTGAAATG 


1680 




GTACGCGCCA 


GTCTTTCTTT 


AGATTCTTTT 


GTATAATTAC 


GATTTTCATG 


TGTTAATATT 


1740 




TCAAAATGAT 


TTGTACATAT 


ATTAT CAT AA 


CGAACATCTA 


TTGATCTCGG 


TGTCACTTCA 


1800 


25 


ACAATTG CAT 


GGTTCAATGA 


TTTGTCCATC 


AGTATGTAGC 


TAAATGAGCT 


TCTGTGTGGT 


1860 




ATTTCTTTCA 


ATAATTGGAT 


TGCTTCTGTT 


ACATTTCGGC 


AATTTTCAAG 


AATTAGACGA 


1920 




CCAATCATAT 


AACATACAAA 


ACCATTTGCT 


GGTTTCTTCC 


GGTGCATAAA 


GTTATAGCCC 


1980 




ATAGTTAATC 


CTGACTCATT 


CATACCATCC 


ATTCTTCCAG 


TTACCCTTGA 


TACAGGACCA . 


2040 




ATTTGAGCTA 


AACCGCTATC 


TGTAGGTTGA 


TAAAGTAAGT 


AGCGACCATC 


ATAAGTTGCA 


2100 


35 


GGGTGGTAAT 


CATAATTTCT 


AACCATGAAG 


TCTTTGCCTT 


GAAAGACCGT 


GCAaCCACTT 


2160 


TCTTTTAAAT 


CGGTAAAACG 


ATAATGTCCA 


AAGTTTAAAA 


TAATTTGGCG 


TGTTGGCATT 


2220 




TTGAGTATAC TTTGTAGTCC 


CATTAATTCT 


TCCCATATTT 


GAGGTGCGTA 


TGTTTGGAAT 


2280 


40 


ATTTGATAAG 


TTTCATTTAC 


ATCTATATCG 


AAACGTGGGA 


CaCnTTTTTT 


CCATTCTTTT 


2340 




TCTCGATTTT 


TTAGAAGAGG 


TGTTTGTTGA 


AGCCATTTAC 


CAGTTTTAAC 


ACCTAACTCG 


2400 




AAATGTGAAC 


CTCTAAAAGT 


CATGATATCT 


GATGTCACTT 


GTTGCATATC 


ATCGGCCCCT 


2460 


45 


TTCTTTTTAG 


TTGTAATATA 


TTGTAAATAA 


ATAGTAATCG 


TATGTATATT 


GAATGTCATG 


2520 




TTAAATAAAG 


TTATATTTTA 


CTAAATGAAA 


TATAAAATTG 


TTTGAGGTGA 


TTTCTCGGTG 


2580 




TATAAGACTT 


ATCAATCAGT 


TAAAACATAT 


TTTTATAGAT 


GGTGGGGATA 


TTGAGTTAAA 


2640 


SO 


AACTTAAAAT 


CATCTTATCA 


TAAATATCAA 


TCTTAAGTTA 


GCATTCACGA 


TAATAGTCAT 


2700 




TGTTAACATT 


AGCATATAAG 


GTCATGTCAC 


GTTGAAACAG 


AGGTTCCTCG 


GCATTTTTGA 


2760 
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TTATTTAATG ATTATTCTAT ATATGATAGT ATAATGAAAT GTAGATAGGT ATTTAATTTA " 28 80 

ACAGAGGTGA AATTGAGATG TGGAATTTTA TTAAATGtGT GkTTAAATTC GTATTTAGCT 294 0 

TAGTTGCTAT TACAACATTA GTTGCTGGTG TTGGTGTAGT AGCATTTGCT TATATCTTTA 3000 

AAAAAGATTT TGAAGATATT GAAAGAAAAA CTAAAGAAAT TATTTCTGAT ATTGAAAGTA 3060 

AAAATAACTA ATAACATTTA GAGGCTGGGA CATAAATCCC TAAAAAACAG CAGTAAGATA 3120 

ATTTTCAATT AGAAAATATC TTACTGCTGT TCTCTATTTn ATcAmTACTt CGTATTGAAT 3180 

GGCTTCGCTT TGCTAGGGTG CCGTCTCAGC CTTGGTCTTC GACTGGCACT GCTCCCTCAG 324 0 

GAGTCTCGCC ATTAATACTA CGTATTAACA TGTAATTTTA CTTTGGAAAT ACTTTTAAAA 3300 

AATAAGACAC TTTGGCCCAA CTTGGCACAT AAATGTAAAA TTCAAT 334 6 
(2) INFORMATION FOR SEQ ID NO: 147: 

20 fi) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2375 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



75 



25 



30 



35 



40 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 147: 

GTTGAAGAAA GAAATATAAC AGTCAATTAT AATTATAACC TTGTTGAAAT CGACGGTGAC 60 

AAAAAAGTGG CTACATTCGA ACATATCAAA GCATACGATA GAAAAACAAT AAGTTATGAT 120 

ATGTTACATG TAACACCACC TATGGGTCCC TTAGATGTAG TAAAAGAAAG TACACTTTCA 180 

GATAGTGAGG GTTGGGTAGA TGTTAACCCA ACCACATTAC AGCATAAAAG CTACTCTAAT 24 0 

GTATTTGCAC TTGGTGATGC TTCAAATGTA CCTACTTCAA AAACAGGCGC ACTATTcGTA 300 

AGCAAGCACC TATCGTCGCT AATAATTTAT TGCAAGTGAT GAATAATCAA ATGTTAACGC 360 

ATCATTATGA TGGTTATACT TCATGCCCTA TTGTTACTGG ATATAATAGG TTAATACTTG 420 



CAGAGTTTGA TTATAATAAA AATACTAAAG AAACAATGCC GTTTAATCAG GCCAAAGAAC 4 80 

GTaGAAGTAT GTATATATTT AAGAAAGATT TATTACCTAA AATGTATTGG TACGGCATGC 54 0 

45 TAAAAGGATT AATATAATAA AGTACAGAAA ACAATAAATT TTTAATGAAA AATCTTTTAC 600 

TATAAAAGAT TAAGTATTTA AATGACGTGT CAGTGTTGTG TTTATATGTC GTGAATTTTT 66 0 

AGCTCTAAAT AGTATAAGAT TGAAAAAGTT GTTACTGTTT TAAATGATCA CGATGAAGTC 720 

50 ATTCAATAAG AATGATTATG AAAATAGAAA CAGCAGTAAG ATATTTTCTA ATTGAAAATC 780 

AT CTCACTG C TGTTTTTTAA AGGTTTATAC CTCATCCTCT AAATTATTTA AAAATAATTA 84 0 
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AGATATTCAA ACCACGTGTA CTCAAAATGA TAGCTTGGTA TGTACCTCCA ATAGTAATTT 96 0 

CAATAACTTT GTCTGTTGAA CACTAAGAGC AATTTTAATT TCATAATGTG TTGTAAACAT 1020 

TTTTTTTGAT TGGAGTTTTT TTCTGAGTTA AACGATATCC TGATGTATTT TTAATTTTGC 1080 

ACCATTTCCA AAAGGATAAG TGACATAAGT AAAAAGGCAT CATCGGGAGT TATCCTATCA 114 0 

GGAAAACCAA GATAATACCT AAGTAGAAAG TGTTCAATCC GTGTTAAATT GGGAAATATC 1200 

ATC CAT AAA C TTTATTACTC ATACTATAAT TCAATTTTAA CGTCTTCGTC CATTTGGGCT 126 0 

TCAAATTCAT CGAGTAGTGC TCGTGCTTCT GCAATTGATT GTGTGTTCAT CAATTGATGT 1320 

CGAAGTTCGC TAGCGCCTCT TATGCCACGC ACATAGATTT TAAAGAATCT ACGCAArCTC 1380 

TTGAATTGTC GTATTTCATC TTTyTCATAT TTGTTAAACA ATGATArATG CAATCTCAAy 144 0 

ArATCTAATA GTTCyTTGCT TGTGTGTTCG CGTGGTTCTT TTTCAAAAGT GAATGGATTG 1500 

TGGAAAATGC CTCTACCAAT CATGATGCCA TCAATACCAT ATTTTTCTGC AAGTTCAAGT 1560 

CCTGTTTTTC TATCGGGAAT ATCATCGTTA ATTGTTAACA ATGTGTTTGG TGCAATTTCG 1620 

TCACGTAAAT TTTTAATAGC TTCGATTAAT TCCCAATGTG CATCTACTTT ACTCATGCGT 16 80 

25 TTGATAAAAA CTTAAATAAT ATTAATTCGG TCATCAGTGG CGTTAAATCT TTTATCATTT 1740 

TTAGTTATAG TTGATAAATT TATATTTATA AGCATATATG GATATTTCAT CAAAAATTTT 1800 

TATTTATATA AATCCGAACT G C AT ACATAT TTGTTTAAAT AAGAGGTATT ATTTTTCGGG 1860 

AAATTGCTGT CTGAGTTAAA AGGATTAGTT TTATAAAATG AGTTGAACTA TAGCCAAAAA 1920 

CGATTAAAAT ACTGATAATC CATTTTTGtA TTATGTTAGG GACTTTTTTA CTTAATTTTA 1980 

ACCCTATTGG aGCmAATATA ATACTCCCTA TTATAAGGAA TAAGGCGTCA TATAAaGGGA 204 0 

T ATAAC CTTG AATAAGTTTG ATGACAAAAG CACCAATTGA AGATATAAAA GCAATTACTA 2100 

TACfATTAGC GACTACAGTA TTCATTGGTA ATTTGAATAA AACCAATAAT ATAGGAATAA 2160 

TAATGAAGGC ACCACCTGCA CCTACTATAC CTGAAATAAT ACCAATGAAA AGGCCAATGA 2220 

TAACTAATAA ATATTTATTA AATGAAGACT TTTCGGAACT AGGTTt CACT TTAATAAACA 2280 

TTAATGTTAA TGCAAGTAAA GCAATAATGA TAT AT AC CGT ATTTACAAAT GTAGCATCAA 2340 

4S ATAAATTTGC TAGAAATGCA C CT AACAT AC TCCCT 2375 

(2) INFORMATION FOR SEQ ID NO: 14 8: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6115 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 
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<Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 148: 
GAGGTTTCTA GACAAGCTTT TAATAACTTA CCAAACTCAT T AAg r TGGTT 
GCCtATTATC mAAG t ATTAT GaGTTCTTTA ATATTAG t GC TAArACATAC 
TTAAACAATT TAGTAGTAAG AAAGCACAAT TCAGTATTAA TCTCACGGAT 
TTCAAATCGC ATATGGTAAA TTAATAATAA TGGCTAAAAA TAATGGCGAT 
GAGTTCAAAC AATTAAAAAG CCAGGTAATT ATATTTTTAA CAAATATCGA 
ATTCTAATTT ACCAAAATGT* TTATTTCCGC TTACAGTGAG AACACGACAA 
CATTTAAACT GAATGGGCGC GATGGTTATA AGAAAGTGAA TCGCCTGTTT 
AAGTGCCACA GTGGGTTCGG GATCAAATGC CAATCGTATT GGATAAACAA 
TTGCGGTAGG AGATTTATAT CAACAACAAA CAATAAAAAA ATGGATTATA 
ATGGAGATGA AT AG CGTTAT GCATAATGAT TTGAAAGAAG TATTGTTAAC 
ATTCAAAATA TCTGTAAGGA ATTGGGAGCA CAATTAACAA AGGATTATCA 
TTAGTATGCG TGGGTATCTT AAAAGGCTCA GCAATGTTTA TGTCAGATTT 
ATTGATACCC ATTTATCAAT TGATTTCATG GATGTTTCTA GTTATCACGG 
TCAACTGGTG AAGTTCAAAT CATTAAAGAT TTAGGTTCTT CTATTGAAAA 
TTAATTATTG AAGATATCTT AGAGACTGGT ACTACACTTA AGTCAATTAC 
CAATCTAGAA AAGTTAATTC ATTAGAAATA GTTACTTTAT TAGATAAACC 
AAAGCGGACA TTGAAGCTAA GTATGTAGGT AAAAAAATAC CAGATGaATT 
TACGGTTTAG ATTATCGTGA ATTATACCGA AACTTACCAT ATATCGGTAC 
GAAGTGTATT CAAATTAATT TTTTAATCAA TTTCAGTTAT TATTACTATG 
ATAATAGTGT AGACTCAAAA ATATGAAAAA TGTATTTCAT ATATATTTAA 
GACATATCTC TTGAAAAGTT GAAAAATATA GAGATTGATA AAACTAATAC 



SO 



GACATTGATG TTAAGCTCAA ^TTACTAGCTT ATAAAACATG TCATATGTTA 
TAGTTTTATT ATGGGAAGTA GGAGGAAATG ACGCATGCAG AAAGCTTTTC 
AGTTATCGTA ATAATAGGCG TTATTATTTT TGGTCTATTT TCATATTTAA 
AAATATGCCG AAACAGCTTA CAT ATAATCA ATTTACTGAG AAGTTGGAAA 
TAAAACTTTA GAAATCCAAC CACAACAAAA TGTCTATATG GTAAGTGGTA 
TGATGAAGAC TATTCAT CAA CTATTTTATA TAACAACGAA AAAGAATTAC 
TGATGCTGCT AAAAAGCAAA ACGGTGTAAA ATTAACGATT AAAGAAGAAG 



gTGtTGGACT 
GAAGAGTGGT 
AAATGGATAA 
ACATATTTTA 
TTAGAGATAC 
AGTGGCGATA 
ATAGATTGTA 
CAGCGCATTA 
ATTAGTAAAA 
TGAAGAAGAT 
AGGTAAACCA 
AATTAAACGA 
AGGCACTGAG 
TAAAGACGTA 
TGAATTATTA 
AAACCGTCGT 
TGTTGTTGGt 
GTTAAAACCT 
CGTTTGAGAA 
TTTTAGACAA 
GGGTGTGAAT 
CAATTTTTGT 
GCAATGTGCT 
ACGGTAATGG 
AAGGTGACCT 
AAACGAAAAA 
AAAAAATTAC 
AAAAACAAAG 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 

126( L 
1320 

1380 

1440 

1500 

1560 

1620 

1680 
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TTTCTTCCTA AGCCAAGCAC AAGGTGGCGG TAGTGGCGGT CGTATGATGA ACTTTGGTAA 1800 

AT CTAAAGCA AAAATGTACG ATAATAATAA ACGTCGTGTT CGTTTCTCTG ATGTAGCAGG i860 

GGCAGATGAA GAAAAACAAG AATTAATTGA AATTGTTGAT TTCTTGAAAG ATAATAAAAA 1920 

ATTCAAAGAA ATGGGATCTA GGATTCCTAA AGGTGTCTTA CTTGTTGGAC CTCCAGGTAC 1980 

TGGTAAAACA TTACTTGCTA GAGCGGTTGC AGGTGAAGCT GGCGCACCAT TCTTCTCTAT 204 0 

TAGTGGTTCA GACTTTGTAG AGATGTTTGT TGGTGTTGGT GCGAGCCGTG TTCGTGACTT 2100 

ATTCGATAAT GCTAAGAAAA ACGCGCCTTG TATCATCTTT ATCGATGAGA TTGATGCTGT 2160 

TGGTCGTCAA CGTGGTGCAG GTGTTGGTGG CGGTCATGAT GAACGTGAAC AAACCCTAAA 222 0 

CCAATTATTA GTTGAAATGG ATGGTTTCGG TGAAAATGAA GGTATCATTA TGATAGCTGC 2280 

TACAAACCGT CCTGATATCC TTGACCCAGC CTTATTACGT CCAGGTCGTT TTGATAGACA 234 0 

AATTCAAGTT GGTCGTCCAG ATGTGAAAGG CCGTGAAGCA ATTCTTCATG TTCATGCTAA 24 00 

AAACAAACCA CTTGATGAAA CGGTTGATTT AAAAGCAATT TCACAACGTA CACCTGGTTT 24 60 

CTCAGGTGCT GATTTAGAGA ACTTATTAAA TGAAGCATCT TTAATTGCTG TACGTGAAGG 2520 

25 TAAAAAGAAA ATTGACATGA GAGATATCGA AGAGGCAACG GATAGAGTTA TAGCCGGACC 2580 

TGCTAAGAAA TCTCGAGTTA TTTCTAAGAA AGAACGTAAT ATTGTTGCTC ATCACGAAGC 264 0 

TGGTCATACA ATTATCGGTA TGGTACTTGA TGAGGCAGAA GTAGTGCATA AAGTTACTAT 2700 

TGTTCCACGT GGACAAGCAG GTGGTTATGC AATGATGCTA CCTAAACAAG ATCGTTTCTT 2760 

AATGACTGAA CAAGAGTTAT TAGATAAAAT CTGTGGTTTA CTTGGTGGAC GTGT AT CAG A 2820 

AGATATTAAC TTTAACGAAG TATCAACAGG TGCTTCAAAT GACTTCGAAC GTGCAACACA 2880 

AATCGCACGC TCAATGGTTA CGCAATATGG TATGAGTAAA AAATTAGGAC CATTACAGTT 2 94 0 

CGGTCATAGC AATGGTCAAG TATTCTTAGG TAAAGATATG CAAGGTGAGC CTAATTATTC 3 000 

AAGCCAAATC GCATATGAAA TTGATAAAGA AGTTCAACGA ATCGTTAAAG AACAATACGA 3060 

ACGTTGTAAA CAAATTTTAT TAGAGCACAA AGAACAATTA ATTTTAATTG CTGAAACATT 3120 

ATTAACAGAA GAAACATTAG TTGCTGAACA AATTCAATCA TTATTCTACG AAGGTAAATT 3180 

45 ACCTGAAATT GATTATGATG CAGCTAAAGT TGTTAAAGAT GAAGATTCTG AATTTAATGA 324 0 

TGGTAAATTC GGTAAATCTT ATGAAGAGAT TCGTAAAGAG CAATTAGAAG ATGGACAACG 3300 

TGACGAAAGT GAAGATCGTA AAGAAGAAAA AGATATTGCT GAGGATAAAA AAGAAGCTGA 3360 

50 TAAATCTGAT GAAAAAGATG AACCAGCACA TCGACAAGCC CCAAATATCG AAAAACCTTA 34 20 

CGATCCAAAT CACCCAGACA ATAAATAATC GATTATATTC AGTACCTCTT TCTATGATAA 34 80 
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AATTGTTATA GCAGAAAATA 


ATTGTAAAAC 


AAGTTACTTC 


ATTATTTAGA 


ATGATGGGTG 


wQUU 




TAGAATAAGT ACAATTGTTG 


CATTTTATGA 


AGTAAAGTAA 


TTTTTTAAAT 


ATAGAGTAAT 


3660 


5 


AGAGGAGATT 


GAAATAATGA 


CACACGATTA 


TATTGTTAAA 


GCATTAGCAT 


TTGATGGAGA 


3720 




GATTAGGGCT 


TATGCTGCTT 


TGACAACTGA 


AACTGTTCAA 


GAAGCACAAA 


CGAGACATTA 


3780 




TACATGGCCG 


ACAGCATCTG 


CTGCAATGGG 


AAGAACAATG 


caCAGCAACA 


GCTATGATGG 


3840 


10 


GCGCAATGTT 


GAAAGGTGAT 


CAAAAATTAA 


CTGTCACTGT 


AG ATGG CCAA 


GGACCTATTG 


3 900 




GACGAATTAT 


TGCCGATGCA 


AATGCTAAAG 


GCGAGGTGCG 


TGCTTATGTA 


GACCATCCAC 


3960 


15 


AAACTCATTT 


TCCATTAAAT 


GAGCAAGGTA 


AACTTGATGT 


AAGACGAGCG 


GTAGGGACAA 


4 020 


ATGGATCTAT 


TATGGTTGTT 


AAAGACGTTG 


GAATGAAAGA 


CTATTTCt CT 


GGAGCAAGTC 


4080 




CaATTGTTTC 


AGGAGAACTT 


GGTGAAGATT 


TTACTT ATTA 


TTATGCTACA 


AGTGAACAAA 


4 14 0 


20 


CACCTTCATC 


GGTAGGTCTT 


GGTGTATTGG 


TAAATCCTGA 


TAATACGATT 


AAAG CAGCAG 


4200 




GAGGATTTAT 


CATTCAAGTT ATGCCAGGTG 


CCAAAGATGA 


AACAATTTGA 


AAATTAGAAA 


4260 




AAGCAATTAG 


TGAAATGACA 


CCAGTTTCTA 


AATTAATTGA 


ACAAGGATTA 


ACGCCAGAAG 


4 320 


25 


GATTACTAAA 


CGAAATCTTA 


GGTGAAGACC 


ATGTGCAAAT 


TTTAGAGAAA 


ATGCCTGTTC 


4360 




AATTTGAATG 


TAATTGTAGT 


CATGAGAAAT 


TTTTAAATGC 


TATTAAAGGA 


TTGGGCGAGG 


4440 




CTGAGATTCA 


AAATATGATT 


AAAGAAGATC 


ATGGTGCTGA 


AGCAGTATGT 


CATTTCTGTG 


4500 


30 


GAAATAAATA 


TAAATATACT 


GAAGAAGAAT 


TAAACGTGTT 


GCTAGAAAGT 


TTAGCGTAAT 


4S60 




TTAATTTAAA 


TCAATACGCT 


AAAATGTTTA 


tttttagcgg 


TTTAGTGAAA 


TGTAGAACTA 


4620 


35 


AATAGTTGTA 


TAATCCTTAG 


TGATTTTGTT 


TGCTTTCTAG 


AATTTATTTG 


ATAAAATAAT 


4680 


TCTATATCCG ATAAATAAAC 


TAAGATTTCA 


ACAACTAACT 


AAAAAGGAGT 


GTTCTTAATG . 


4740 




GCAGAAAAAC 


CAGTAGATAA 


TATTACTCAA 


ATTATTGGCG 


GTACACCGGT 


AGTCAAATTG 


4800 


40 


AGAAATGTAG 


TAGATGACAA 


TGCAGCAGAT 


GTTTATGTAA 


AATTGGAATA 


TCAAAATGCA 


4860 




GGTGGTTCTG TAAAGGATAG 


AATTGCTTTA 


GCAATGATTC 


AAAAAGCAGA 


GCGAGAAGGC 


4920 




AAAATTAAAC 


CTGGCGATAC 


AATTGTAGAA 


CCAACAAGTG 


GTAAT ACAGG 


TATCGGTTTA 


4980 


45 


GCATTTGTAT 


GTGCTGCTAA 


AGGATATAAA 


GCAGTATTTA 


CTATGC CCGA 


AACAATGAGC 


5040 




CAAGAGCGTC 


GTAATTTATT 


AAAAGCATAC 


GGTGCGGAAT 


TAGTTTTAAC 


GCCTGGATCA 


5100 




GAAGCGATGA 


AAGGTGCAAT 


TAAAAAAGCT 


AAAGAATTGA 


AAGAAGAACA 


TGGTTACTTC 


5160 


SO 


GAGCCACAAC 


AATTTGAAAA 


CCCTGCGAAC 


CCTGAAGTTC 


ATGAGTTAAC 


TACAGGTCCT 


5220 




GAGTTATTAC 


AACAATTTGA 


AGGGAAAACT 


AT CGATGCGT 


TCCTAGCTGG 


TGTTGGTACT 


5280 
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GTTGCTATAG AGCCTGAGGC TTCTCCAGTA TTGAGCGGTG GTGAGCCAGG TCCACATAAA 
TTACAAGGTT TAGGTGCTGG ATTTATTCCA GGCACTTTGA ATACAGAAAT CTATGACAGT 
ATTATTAAAG TAGGAAATGA TACAGCGATG GAAATGTCTC GTCGAGTTGC TAAAGAGGAA 
GGTATTTTAG CAGGTATTTC ATCAGGTGCT GCGATTTATG CTGCCATTCA AAAAGCAAAA 
GAATTAGGAA AAGGTAAAAC AGTAGTAACA GTATTGCCGA GTAATGGTGA ACGCTACTTA 
TCAACACCTT TATATTCATT CGATGACTAA TTAATGTCAT TTAAAAGAGT GAGTTATCTT 
TTTGAGATAA CTTGCTCTTT TTTTCTACCA TGTATATTTT TAAAAATATG AG CGTTAAAT 
TAAACATTTT TCTGATAAAA ATATC CAGTG AATGATAAGA TAATAAACGT ACATACTAAT 
AACTAGTAAA TAGCAGGAGT AAATTTTATT AGAGTTAAAC AATACATAAT TAAAGGGTGG 
TTAACATGAC TAAAACAAAA ATTATGGGcA TATTAAACGT CACACCTGAT TcATTCTcAG 
ATGGTGGAAA ATTTAATAAT GTTGAATCAG CTATAAATAG aGTGAAAGCC ATGATAGATG 
AAGGTGCTGA CATTATAGAT GTTGGAGGTG TTTCAACGAG ACCCGGTCAT GAAATGGTTT 
CATTAGAAGA TGAGATGAAC AGAGTATTAC CTGTTGTTGA AGCTATTGTC GGTTT 
(2) INFORMATION FOR SEQ ID NO: 149: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10401 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 149: 
TAGATACTGG GnTAAAcaTc AAAAATAtyT GCtTaTTCaC GTGTTTAcGc TCCCtCAAAC 
GCAACGTTAA TTGCGTGTAA TCATTTAGTG TGAATTcAGA CGCTTCTTCC ATGACTATGT 
CTGATATGCC TTTTATCGAC TTTATTTTCT CTGGGTTATC TAATCCTTTA AACAAAAAAA 
CTGCGCCGTT TGGCAATTCA A C TTT G TTAT CAGTCTTATT CCAAAGGCAC ATGTCCCAAA 
TACCAAAGTT TATCAAACAA TCTTTAACAT CTTCGAACAA ACTATCTTTA ATTGTTGATT 
GTACTTTTCT AAGCCACAGT ATACGCCTAG GATATTTCCA ATCTTGCAAT GCTTTGAGTA 
CAACTTTTTG TATAACGCCG TGAGACTTAC CGCTCGAACC TCCACCGTAA TGkACTTCAG 
TGAAGTtATC GTAATTGGTT AGTATTTCGA ATATGTTTCT ATTGAAAACA TTAGACGGTT 
TGTTAAAGTT TAATTTAACT TTCGTCATCG TACTCACCAA TATTAATCTC AATATTCTTC 
TGAGTAATTT CTTTTTTATC GATATACGCA CCATGTACTT TTAGTATGTG GTCAATAGAT 
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TTTAAATGGT 
GATAACGCTA 
TCTTTAATAT 
GTTTTCTTAC 
TATTCATCTG 
ATACGCTTTT 
ATTCCTAATT 
TCTCATTTAA 
TCCGCCAATC 
ATGTCAACAC 
CGTTCTTTCC 
TTACCTCTTC 
GACGGTACAA 
CTTCTTAAAT 
TTTCGAACTG 
AATATGTTTA 
TAACTTTTAC 
CTAGTAATAT 
AATCAGACTG 
TCATCATAAT 
ATAATAGTCT 
TTGTATAGCT 
ATCAGCTGAC ~ 
TACTACTAAT 
TCCTTATCTT 
CAACTGTAAA 
AATCTTTGAA 
AAGTTTTTCT 
CTTTGCAAAA 



CATATTTCTT 
AAGCTTCTGT 
ATTCCGAAAC 
TATAACCTGC 
CGAATCTCTT 
TAAAATTAAA 
GCGATAAGGG 
GGTATCAAAA 
TAGATATGAT 
AAACTTTCAC 
TGCTTGATGT 
GTATACTACA 
ACTCCCCGCC 
CTTCAAGTTG 
TTGATAATTT 
ATCTTCAAAG 
ATCACCTTTT 
AATTGCTATG 
ATCACTCAAC 
ATATACTTGC 
CAAAATTTCT 
TGTTTTAATG 



MTAACTCAC 
AAGTTTTCAT 
AACTTGTGCC 
CGTCTGATTA 
TGTTGTGACT 
ACGAATAAAA 
TCTACTATAA 



ACTGTAAGCC 
AATACTCATT 
ATTAACATTT 
TGTAATTGCT 
TTGTTTTTCG 
AAAGGATTGG 
AAACGCAGTA 
ACTGCCACTT 
TTTTCTTTTG 
TAATTCCTTT 
GTTGATTATA 
AAGATAATTA 
TATATTTGTA 
TTTATGATAA 
TAATCCGTAT 
TGTCTCAATC 
AACTGTTCCG 
ATTAACCACA 
TTTGCGAAGT 
TCAGTTACAT 
TTAACCACCA 
CGTCTCTTTT 
TGTCATATTC 
CTACATCAAT 
TCGTATTTGC 
TCTCTAGCAG 
AAGTATTGCG 
GTATTAGTAC 
CGATTAAGAC 



TCTTGAGGTT CTCCTCTAGC 
AAACGCTCTT CTTGTATCTG 
CTTAACAATC GACTTGCTAA 
GCTTTTTTAC CATTACATCC 
TTCATTTCAT TTACCACCAA 
CTATAATCAG CCAACCCACA 
CGATAGTCAA TATCCTACAC 
TACTGCCAAT TTCAGTCTTC 
ATTCTATGAG CAGTTCTATC 
TTATTAAAAT AATACTCTTG 
CGTTCAATAG CGCTCTTAAA 
GTTACTGCCA TTTCTGTTTT 
TCTGTTGGAA TCCACGGTGT 
TTAGGATAAT CACACAACTC 
TTCTTTTTAG TCATGAATAC 
TACTTCTTAA TATCTCTATC 
CTTGTAACAT CACACCAAAC 
TCATCTACTC CGACACCTCC 
CACTTGGCGC CTCTACATCA 
ACTTACCTAA CTCATACATC 
CTAAACACCC CATGTTAATT 
TTCTTTGATA TCTCTATTAT 
ATATAATAGT TCTGATATTT 
CGTTACCGTT TTCTTTGGCA 
GCTCAGCTTC TTCTTTACTC 
TAGTAAAATG TTCATGTGGT 
TCACTTCTTA TCACTCCTTT 
AACACTCAAT GTAGCCAACA 
TAATAACATT CCAATTCTGC 



AATAGAAGCA 
TTCTAATCGT 
AGACTCTGCT 
ATTCATTATA 
CTCTCGCGCT 
TAGATCCTTT 
TATCATAATA 
CCCTAACTCT 
AGAAATGTGT 
AATGAATTCG 
CTCAAGGATT 
CGATGTATTA 
CATTATTTCA 
ATCTTCTAAC 
CCTCCGTACA 
TCTCGCTCTT 
AATAAGATGA 
GCCCTCATCA 
TCATTAGCCG 
GCTAGTAAGA 
TATCGATAAT 
CGCCATCTTC 



CATTACTAGC 
TCTCCATCTC 
TCTGCCTCAA 
TGTCCTGTTG 
GAATGATTCT 
TATTTTTTTG 
ATGTAAATAA 



720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
144 0. 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
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TACAAGTATT 


GGAACTAATG 


TAATGATGTA ACTCACTTCC 


CCAAAACCTC 


CTTGACTCGA 


2520 


TCTAAGATGT 


CTTTACACTC 




GAAGCClTl'l 


TCTCCACGTT 


CTGAAACACT 


2580 


TTCGAATTCC 


TCCACTTGCT 


^P^P & r 1 w i - */"* TV f~*f^ 

i. 1 ALj X 1 V_AtiO 


>TV«*V/*^ , ^ tv TV TV 

TGTCCATATA 


GGCACGATAA 


CCAATTGAGC 


2640 


TAGTTTGTCT 


CCTTCGTTGA 


•V M|wp^ «m« TV /"•T 


T CCGTATTGT 


CTTATGGCGT 


CACTCAAATC 


2700 


GATTTCTCCT 


TTAATATCAA 


R R APR f~T* r T*r , r* 
AAALALL TGG 


«V »»|»^ TV T* TV T fv TV 

TGTGATATAA 


CCATTCGATG 


CAATAGCGTC 


2760 


ATTCTTGATA 


TTAATCCCTA 


AATTG CCGTG 


ATATCCCGCG 


TCTATCTTGC 


CTGTTTCAAT 


2820 


CACTAAATGC 


GTTTTACTAC 


1 i ACA U CACT 


ACGGCTTAGTT 


AATAGTCCGA 


CATAGCCCTC 


2880 


TGGTATGCTT 


ACAGCTACAT 


CTGTTTTAAT 


CACTGCCTTT 


TCTTGTGGCT 


CAAGTACGAC 


2940 


AGTTTCAGCT 


GAGAATATGT 


CATAACCTGC 


ATCCGTCTTA 


TGATTTCGTT 


CGGGCATTCT 


3000 


AGCATTTTCT 


GATAATAGCC 


TTACTTGTAA 


TGTGTTAGTC 


ATTTTCCTGC 


TCCTCCCTAG 


3060 


CTGTAGCAAA 


CGCTATTCTC 


AATTTCAATC 


TTTCAACAAT 


ATGAATTAGT 


GCGGTATTGA 


3120 


GGAATATTTC 


AAATTCTTCA 


ATGTTCTCAT 


CTATAAAATC 


AAGTATTTCT 


TCCTCTTGTT 


3180 


CACTGTCAAA 


CTCGCTTAGT 


ACATCCCAAA 


TATTTATGTC 


GCTTTTGCTC 


GTTT CTAATA 


3240 


CTCTTTTGAT 


TATTTCTGAA 


TTACl'I'lTAT 


TACTCATTTT 


CCTTGTTCCT 


CCTCATATTT 


3300 


ATAGACAACT 


TGACCTGCCA 


TAATCCCTAC 


TGCTTCATCA 


AGTTCAATAC 


CTTCTTTAAC 


3360 


TGAATGTTGA 


ATAGCATTTG 


TCATTCCCTC 


AAGT ATTT CA 


TCAAACGCTT 


GTGCTCTCTT 


3420 


ATACACGTCC 


TCAATCTCTT 


TTAGTAATC C 


CTCTGTGTCA 


TTACCGTTAT 


ACGCACTAGC 


3480 


ACTGATCACT 


GATTGTTCAA 


TTTGTTCGCG 


GTTATTCATC 


ATTTCCATCT 


CCTCTAAAAT 


3540 


AAAGTTAGTT 


GCTTCTGCTC 


CTCGTATTCC 


AAAC CATGTT 


GCTTTATATA 


TGTTTCGAGC 


3600 


TCTTCCGCTG 


TATCAAATGT 






CTGGCACGAT 


ATGCCCATGa 


3660 


AAGT&ATAAG 


TGCCGTTCAC 


»T*TV f»TV TV*/"* TV T» JV 

TACATGGATA 


TGTGCCACTC 


GTTCGTTATC 


CTGATACAGA 


3720 


TATCTCTTAG 


ATCCGAAAAA 


TTGGTTTAAG 


T ATT CTTTAC 


ATGCGCTATC 


GGTTTTAGGC 


3780 


ATTTATGCTT 


CCTGCCATTT 




»TV**/ wfl* TV T»7V TV /"^ 

IVjVjI TATAAG 


TAGTATCAAA 


CCAGTACGGA 


3840 


TCACGTGAAT 


GTTTTTGAGG 




TV TV TV T/^T/V/^T 

AAATGTGGCI 


TCTTCTTACG 


TAGTTCAGCC 


3900 


TC1TTACGTC 


GTTGCCTAGC 


CATTTCACGC 


TCTTTGCTCT 


CTCGCTCCAT 


GATTTTGGAT 


3960 


AACACAATTT 


Vw A * A £\ X Av x w 


AGCTAAGCGC 


ATACCATAAG 


flTYV ATY2T A A 


Vj<jV_ 1 1 \- 




AACGCCCAGC 


CACCTCGTAC 


TCTTTTTGCA 


ACCATTCCTG 


GAGTTAAACC 


GTTCTTTTTT 


4080 


ATCAATTCAT 


TTTCATGTTC 


GGTAAATTTA 


TATGGTTTAC 


CGTTAATCTT 


TACGATACTC 


4140 


ATTT ATTC CA 


CCTCTATACA 


TTTAcrrrrr 


TTAATCCAAT 


CCTCTAATTT 


GTGCGTGTTG 


4200 
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ACATTTAAGT 
ACGCCAGTTT 
AAATTAGTTG 
ATTGTTATGT 
GTATCTTTTT 
ATATCAATCG 
TCTTTTACGT 
AGGCGCTTTA 
TTTGATGTTG 
TTCCTTCCAC 
TTGTAATTCA 
TTCTAAATAT 
AACTTTCTTA 
GCAATCCTAG 
TATCAGTCAT 
TTACGTTGTC 
AATATTTTTC 
CATTCATGAT 
CCAACAATCT 
TTTGCTTTGT 

gaaaAacctc 

GTTTTTGGCT 
GTTATAATAAT 
TGATTCTTTC 
CAGTTGTGAA 
TGATATCTTT 
ATAATCTATA 
TGCGGTGTGA 
GCATTCGTTA 



TAACCATCTC 
CATTGTGCAA 
CGAATACTtC 
TGTCATACTT 
CTTTATCCAC 
TTGCGTTTAT 
CTGACTTTCA 
CATATCCACG 
GCAACTTCAG 
AAAGAGAAAT 
AATTTCGGTT 
TGGTAATATT 
GCATTGTATT 
CTCTTGCTCA 
AATTTTCTTT 
TTTATACTTG 
TTTCGGCATT 
TTTCTTTTCA 
ATTGACCGCC 
CTCTTCATAC 
TGAGTCTTCT 
ATGTTACATT 
TCATCACGGT 
ATGTCCGATA 
AGTAGTACGA 
TCTACTGCTA 
AAAATAACTT 
TATTACTTTT 
ACTTTGTTAA 



AGCTTTTCCG 
ATCTTGGACA 
GTTCAACTTC 
TAGTAATTCG 
ATCATCGTAA 
ATATG CTTGT 
CTAAGTCCTC 
TTAAATTCAC 
TCGCCTTACC 
CGGCTATATA 
GTATTTCGAT 
CGCACTCTAC 
TACTCATTGT 
TATAGAAGCC 
TCGTCGCTGA 
ATGACCTTAA 
TTTTAACACT 
ACTCTGTCGT 
CAACCAGTCT 
ATCGATTTCA 
TGTAATACTC 
CAACAATAGA 
AAAGTAGCAT 
GCATTGGTCT 
TGATTGCGCC 
CACGTCTATC 
GTTGCCTGTC 
ATCAGAAATA 
GTCATCCGGC 



TTTTTATATC 
CTTACGTTAT 
ATTTATTCCA 
TCCGGATTGT 
TGCTGATATT 
TGTTGCATTA 
ATATACCATC 
ATCTCTATAC 
TTTAACGTCT 
CGTAATCGGT 
ACGATCATAG 
TTTGCTATCA 
GCCACCTCTA 
CGTGAGCGCC 
AATGGG CTC C 
TATCTTCCGT 
CCTTAATGTG 
AATCATCGAA 
CGATATATAC 
ATAAGCTTTT 
AAATTCAATT 
TTTGCCAGTG 
CGCTAAACTC 
TTTATCCTGT 
TGTCTCGTTA 
AACTTTCGCA 
TGAATGCCTC 
TCGATGCCTA 
GTTAAGTTCC 



CACTAATAGT 
CTCTAGCCAT 
CCTCTATATA 
CATCTAAGCG 
CAACTTCTGT 
GATCACTTCA 
CATTCTTGAC 
TGATATCTGA 
ATAACTTCAA 
CTTTGTTTCC 
TTAGTGCCAT 
AATACAATTC 
AATATCAAAT 
TTTGAATCGT 
TGTGAGCGAA 
GCCATCTTCT 
TGTTTTCTTC 
AGGCGATAAC 
ATTTGCTACA 
GAATTGCATT 
ATTCCGGTTT 
ATACTGTCAT 
GCATCTGCTT 
CTAGACTCGA 
GCGATTATCT 
TCAGTATCCA 
ATTG t TGCGC 
ATTTCATGAT 
TGATTTCTTT 



TGATCTTGAT 
GATTACCCTT 
TGCATGTCTT 
CTTTGCCAGC 
AGGTATTCTT 
TTTCTCTTTT 
CTGTGTATTT 
ATATCTTCGC 
CCAGTTTCCC 
CGAATTTAGG 
TCATATTACT 
CTTTGTACTC 
ATCGTTGCTT 
TTTAGGTCAC 
TAAACTTCAT 
CGGTATAAGT 
CAGTTGATTT 
TCGTTATTGT 
ATCGGGTCGC 
ATATTCATGT 
CGCCGTCTTT 
CTTCGTCACG 
CTATTCCGCC 
CACCACGATT 
TTAAGTCACG 
TCAGTTGAAG 
TCGCACATCT 
TTTATCCATC 
TATCTTT G TT 



4320 
4380 
444 0 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
"564 0 ~ 
5700 
5760 
5820 
5880 
5940 
6000 
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AGACTAAAGA AAGATGTTTT GTATCCATTT TGTGCTATGT TCAGCATCAT GTTTAATGCA 6120 

AAACCTGTCT TACCCACTGA GGGACGCGCT GCGATGACGA TTAATTGTGA TGGTTCTAAT 6180 

CCC CCTATTT TGTAATCCAT TAG CTTGTAA CCCGTCTTAA TTTGCTTCTT AGGGCTATCG 624 0 

CTGTATAACT CTTCGACAAA CTCCTCAACA AACTTCTTGG TTCCATCTTC TTTTTTGTTA 63 00 

GTAATTGTTT TTAAATCCTT GAGTTCATCA ATCAAGTTGT TAAAGTTTTG GTTCGTAGGT 63 60 

TGTTGTTTGA ACTCAGTTAC CAATTCGTTA GCTTTGTTGA GCTGATAACT TTCCAATAAT 64 20 

T CTTGTTG AT AACGTTCAAA GAAGCCATAT CCAATGAAAT CGGAGTTGTA AAGTTTAGTT 64 80 

AT AGT AT CTG CATCTAAAAA TTCTTTATCT TTAGTTGCTT TTAAATAGAT TTCTTGATGA 654 0 

TCTATCTTTC CGACGTCCAT TACATAATTG AAAAAGGTTT TAAACTTTTC GTTCGTAAAC 6600 

ATGTAATCTT TAACTCTTAT CTTTTCTAAT ACGTCCGGTT GTTTAAGTAG CGTAGCGATT 6660 

ATTGTACTTT CAATTTCGAA TTGTCCGTAA TTCATTCGTT TTCGCCCCCA AATTCTGCCA 6720 

ACTTATTCAT GAACTTATCT AGCGCTATTT TTCTTTGTCT GACATATTCG GGGTCATTCT 6780 

GCATTTTCCA TTGGTGTGTA GCGGTTTCGT TATCTACTGG CTCGATAGAT ACTTTTTTAG 684 0 

25 GTTC CTTACG CATGATTGCT GGTAAGTTAG GCGGGTACGG GTTGTTACTG TTGATATAAA 6900 

CATCTACCGC TTTTACAGTT GGTTGATAAT CTCCATTTTG ACTTAATACA TCAATCCACA 6 960 

TTTCTAACTT CGGTTTATCA AAATCAATGT TGTATACGTA CCTAACTTTT TTAATAATTT 7020 

CTAATGCTTG TGTTTTGCTC ATCGGCATTA GTCATCACTC AATTCTTTTT CCATTTGTGC 7080 

AATGACATCA TCAGT AG TAT TTTTTCTAGG TGCTATTTTA TTTTCTGCAT CTTCTTTTGT 714 0 

TTTGACATTC TCTTTAGCCC AGTTGTTTAA AACTTTAATT AAATAGCCAC CATGCGCACT 72 00 

TTTGCTTTTA GTGT ACT CAA CACCTACTTT TACAACTTCA AAAGCGTTTG TACCTATATC 7260 

ATCAATAGCA AACCCTAATT GTTCCATTTG ATTAGGTGTT AACTTATCAT CCAAATTTGC 7320 

AATTATATAT TTTATTGAAG ATGAGAAGAC GGCTTCTCTT TCTTCTTCTT TATTCTTATA 73 80 

TTCTTCTTCT TTTTCTTCTT CTCTTTCTTC TTCTTCTTCT GTATCGTTAC GTAACGTTAC 744 0 

GGTAACGTTA CGTTTTGCTT CTAGTAACTT TTTCTGTTTC TCACGATAGC GTTGTTGTCG 7500 

CAATTTATTT TTTTCTTTAT GCTTAGCTTT GCTATCTAAG CTTTGATGCT TCTCCCAGTT 7560 

TGTCACTTTT ATGACACCAT TAACTTTTTC AATCATGCCC AATGTCTCAA AAGTTTGAAT 7620 

TGCTAACCTT ATTGAGTTAA TAGGTCTATT AAATTCATTT GCTAACATTT CTTCGTTGTA 76 80 

SO CGGCAAGTTT TCGGATAGCA TAATATAACC TTGTTCATTG TACTTTCCTG ATAAAGTTAG 774 0 

TAACTTAACC CAAATAGTTA TGATCGTATC TCTTTCGGGT AAAGCTTCGA TATATTTGAT 7800 
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CTCCTTTCAG CATTTTGTTG AGCCTCTCAT CAACTTTTAT CCACGAGTCA TGCAAGTGAT 
ATTTATCATC AAACGACTTA ACGCCAATTG CGTGCTGTTC ATTATGATGT TGTCTACACA 
GTGCTAACAC ATGTTTGTCG TAGTGATTCA TTTTGTTTCT GTTCATGCCT CTGCCGACTG 
CTTCATAATG TGCCAGGTCT GCGTGAGGCT 1TCCGCATAT TACACAGTTG CGGTTGATTG 
TAGCCCAATA TAATAACGCT TTATCTTCGC TTAACAACTT ACTCGTTTCT ACACTCATAG 
GTATTTGATG ATGAAACATA AACGCTATAA TCAGTTCTAT TAACTCCCTT GCAACTTTCA 
TAGAACAGTC GCGCAGACTG ATTTCTTCAT AACCTTTCAT AATTTCCAAT TCTGTTTGTA 



7920 
7980 
8040 
8100 



6400 
8460 
8520 
8580 
864 0. 
8700 
8760 



70 u 

8220 
8280 

75 ATAATTTTCT AGTTGATTCT ACTGGTTCGC CCCAGTGAAG TTCTATATCT CTACACATTG 8340 
CGAATATTTT TTTGCGTTGT TCTATAGATA GTTTTTTATT GTCCGGAACC TCTACTTCTG 
CTTTTAGTGG ATATCCGTTT TCTAGTAAGT CAATGTGACT TTGTTCAAGT TCAACAC CAG 
20 TAGCAACGAC GGAATAAGTA CCGTCATTGT CTTTCTGGTA TCTTGTAATG TATTGCATTT 
AAACCACGTC CTAGAACGGT AAATCATCAT CATTGATTTC TATTGGACCA TTAGCATTAG 
CGAATGGGTT TGATTGTTGA CTCATTGGCG TCTGTTTCCC ATTTGCTTGC TGTTCTTTTT 
GTTTCATCTC ATCAGTTTTA GGTTCTGGTT TATTAACTAC TTCATCGTCT TTATTCCAAA 
CTTTTACATA TGAGAGTCTT ACAAAATACT TGCCTTGTTC CTCGTTAAAT TTATTTTTAA 

GTACAATAGT TCCGATTTTG TTAATTAATT GATCTGTGTC AAAAGTTAAA TCTGGTAAGT 8820 

TCAATTTAAT TCCTAATCTA CTAAGTAACT CGATATATTG TTTTTCTTGA TAATCTTGTT 8880 

GGAATGGTGG GACGAATTGG TTGTGTTTGT ATTGTTTACC TTCGTTGTTT TCAAAAACAA 8940 

TCGTGAAGTA TCTGTTTTCT CTGTCGTTAA ACTCGACATT TGCAACTTTT ACTGTAAATT 9000 

CTCCAGCTCC TAAAAAGTCC CCACCTTTCA TGAATGCCTC TTGATTAGTT TCTTGAATGT 9060 

ATTGTGTTCT ACCAGTGATT TTCATAATTT TTATACCGTC CTTTTAATTA ATTTTTAATT 9120 

^ ACCATTTCTA ATTGCTTGTA CAACATCGTT AATACTTGGA TTAATGAAAC GTTTGTTGTT 9180 

AATTTTGA^ GTCTTATCTT TOTCT^AAT AAATTTGATG GTTCAGCGTT ^240 

AAGTACATAT TGATAAGTTT TTTCGCCGTC TTGCTCATGT TCTTCTATTG TCATTCTTGC 93 00 

45 TAACACGTCA GATTGACTGA TGACTGCTTT TTTTATTTGG TCTTGTGCCT CTATCGTGAT 9360 

TGTTGGATTG ATAGTACTTC CCTCATCATC TTTGTCTTTG TTAATGCCCT CGTGTCCGCT 94 2 0 

TATAGCAAGA TGAAATTGAT AATGTTCTTG TAATTTAGAA ATATAACGAT AAATACTTAC 94 80 

AATGCGTGTA GCACACTCGC CCCAATCATT AAATGTCGGT TTCTTTGATT TACCGTCCAT 954 0 

GATGTCGTCC ATAGTGATAT CACGTAACTT TTGGATTGTT TCAATCACTA CAACATCAAT 9600 
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AAAATGCTTA TAATTCTTAA TCTGCACAAC TGCCCCATCT TCTGTTACCG TTGTTCCGTC 9720 

CTCATTTATA TCTAGTACTA AGGCATTGTT ATCTTTTGTT AAAAACGTAG TTTTACCAGT 9790 

5 ACCGAACTTG CCGTATATCG CAAATTTATA AAACTTGTTT GCATTTTGTT TGCTGATGTC 9840 

TTTTACACCT AGTTG CGTTA AAATATCGAC ATCTTGATTA GTTTTTTCAG TCATCTATTC 9 9 00 

TCCCACCTTT ACCGTGTATG ACGTTGGTTT CTCCACAATG CTAGCACCCT CTAAAACTTC 9 960 

10 

GCCGTTTGCG TCAATCAATG TGCCGTTTTC AGTTACATTG AAATCTTTCT TAATGTCTGA 10020 

TTGGCTAAGT TTTTTAGTTA CTTTTACATA GTTGTCAAAA CCTCGTTGCT CAAGTTGTnT 10080 

AATGACTTCT TGCTCATTGC TAACTTGAAT GACTTTTGAA CCTTTTCTGG CTGTCACTTT 1014 0 

is 

TCCGTAAGtG TATTCAACTT GAATTTGCTA TCTTGTTCTT TTTGTATTCT GTAATATTCA 10200 

ATTACAAGGC TTTGTAAATA TTCTTTGCCA CTCTGTAATT TTTCTACTTC TTTATCTTTC 10260 

20 CATTCGTTTA TGCGTTCAAT TTCTTTATTT GCTAAATCGT TGATTTCATT CTCTTTAGTT 10320 

GTGATTGCAT CCAGTTTCTn AAAAACCCAG TTAGCACTGT CTAGATCAGT nACTTTGAAT 103 80 

CGGTCGTCTT GTTCGAATGT n 104 01 

2$ (2) INFORMATION FOR SEQ ID NO: 150: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2989 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
30 (D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 150: 

3S 

TTTCTCTCTA TTATTCTCGA TGCGTAGATA ATTGTTTAAA TTTAAGTTTA TAGTAATGTT 60 

GAGTYTATAA TTTCATATAT CTAAAAACAG GTGTTGTATA TATAATCATT CATCTAGTTA 120 

TACTTACTTT AAAAATAATA TAATTTCATG CGATGCAATT CATTGATGGA TGTTTTTAAT- 180 

40 

CTTAATCAAA TCCAaATAAA G CAT AT ATTT TTAAATTCAC TTTCTTTCGA ATCGATTTTT 240 

ATCTCTTGnA TTAAACTTTT CCATTGTTTC ATTAAAGCTC TCTGTCATAT CTATTC CCAT 3 00 

4S TGAATTCGCT AAACATAACA ACACAAATAA ATTATCACCT AATTCTGCTT TAATCGTATT 360 

TGCTTCCTCT GAATCTTTCT TCTTTTTTTC ACCATAGGTA TGATTTATTT CACGTGCAAG 4 20 

TTCGCCCACT TCTTCAGTCA ATCTAGCTAA GTTAGCTAAT GGTGAAAAAT ATCCTGTTTT 4 80 

50 AAATTGTCCA ATATATTCAT CAACTTCACG TTGCATTTCT ACCATTGATT TCATTTCTAC 54 0 

GTTCTCCTTA TATTGCATTT CTAATATAGT ATATATCAAT TTGAAGTCTC ATGCATGTTT 600 

55 



767 



E P 0 786 519 A2 



w 



15 



20 



25 



30 



35 



40 



45 



SO 




TAACTAAATT AAATCAATTG AAATTGGGAT 
AAATAATATA GTGAATAATC TACCATTAGA 
CAAAAATGTG ATTAGCTAGT TAATAAGTGT 
TTAATCACTT GAACGCGCAA TCAAAATAAT 
TGCTGCAACA TAAGTCATTG CTGCTGCAGA 
TTCATTTACA ATGTTCAATG CCGTAATTTG 
AACTGGTAAC GTAACAATTG AGAATAATAC 
TAAAGCAGTT GAACCaAATG CACTACCTAT 
CATATAACTT AATGAACTCC CTAGGTTTGC 
GAACCAATAT CCTTGGTGAT CTTGAATGGC 
TCCAGCAACT GATGGTCTGT CATAGTTTGC 
ATCGTAATGA TCTGTTAAGA ATCCTTCACC 
TGCATGTAAA ATTTCTAATG CAACTTCACG 
TGAATATTTC TCATAGTTAG ATTTAACTTT 
TATTACGAAA TAAATTATCA TAGTAAAAAT 
ATATTTTACT GTCATTTGCC GTTTTTATCA 
TCAATATAAA GCAAAAGTCC AAAAACACTT 
ACATGTGTAG TTATAAAATC ATAATATGGA 

ttcaaaaaca cccaaatcat ygctacactg 
tagaagtaaa ttgcctgaac agccattata 
actgtaatat caccttgttc aataataaat 
tatttgaata atgttacaaa tgccagtgca 
atcaatcXga^taga^^ 
ttaaaatgcc agggcgtatg acttaattgt 
cctaatatat tacaaatgag tagcatcatt 
caaaatgctt taattgtcat ctgctaagtc 
gagtgtattt aaaatttgcg ttagttgata 
taaatcaata ttgtgtaaca agtaatctat 
catactattt aagtcatgaa gataagtttg 



720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
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TGACACGTTT GCGAAGTGAA TTTGAATATC AAAAGCACAG TTATGATTAG CGATATAATC 
AAATATTTCA TTTGTATTCA TTAACTTTAT ATTACGCTTA GTAAATTGAA TTGCAGAAGC 
GTGACTTCCC ACTTCTGCAA TTTCTAATGT TTCATGATGA TTAATTTTTG TATCTACAAA 
ATGAATGTTT GCCAATTTCG CCTCATTCAC TTTTATATAG TTAAGCACCC AAACTGCAAT 
ACGCGACTTA AATCGATATT GAAAAAGTAA ATATTCAATA AAACTTTCTT TAATTTGATT 
GAGTGTCTCT GACATCAAAT ACCCCATTTT AAGATTGCAA TCTTGaTAAT TCGTCATGCC 
AATTTTCGTT ACTTGGcTCT AGTTCCAACA ATTGATTTAA AATAGTAATT GCTTGTTCCT 
TTTGACCAAT TTCAATTAAA TAGAAATAAT AATCACTCAT AAAATCAATA TTTGTTTTCA 
TCGTTGGATA TGCTAATTCA AAGAAATGTT GAGCTTCTTT ATCTCGCTC 
(2) INFORMATION FOR SEQ ID NO: 151: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1143 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNE SS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 151: 



CATCAACTCC 


TTAATTACAC 


TGTAAATGAT 


ATGCGTCTTT 


TTGACAACTA 


TATTTGTCAA 


ATCTACACCA 


AAAAATATGA 


TTATCCACCT 


ATGTATGACA 


TTTTGAAACA 


AACACCTCAA 


CGCCTACAAG 


TCATAATTGT 


TTACTTTCGT 


TACACCTTCC 


TGCATAATTA 


ACAGCATTCT 


AATTTTAGTA 


TGATGCACGC 


ATTTTCACTA 


AATCAAACCA 


TTCAAAGGAG 


ACTATTATGG 


CATTTACATT 


ATCTGCAATT 


CAACAAGCAC 


ATCAACAATT 


TACTGGTGTT 


GACTTTCCAA 


AACTOTTCAA 


AGCTTTTAAA 


GATATGGGGA 


TGACTTACAA 


TATCGTCAAC 


ATTCAAGATG 


GCACTGCAAC 


ATACGTACAT 


CAATCAGAAG 


ATGATATCGT 


TACGTCATCT 


GTAAAAAGTA 


ATCATCCTGT 


TGCTCAAAAA 


TCAAACAAAA 


CAATAGTTCA 


AGACGTCTTA 


ACTAGACATC 


AACAAGGGCA 


AACAGATTTT 


GAAACATTTT 


GTGATGAAAT 


GGCTGAAGCT 


GGCATTTATA 


AATGGCATAT 


CGATATTCmA 


GCGGGCACTT 


GTACTTATAT 


CGACTTGCAA 


GACCAAGCTG 


TTATTTCAGA 


ATTAATCCCT 


CAATAAACTA 


TATTTATAGC 


AACATTTTAA 


TTATTTCATA 


AAATTTTATT 


GATAATCATT 


ATCGTTCGGT 


ATAAAGTAAA 


TACTATATAC 


TACTTATGAG 


TGAGGTTGAT 


TATCATGATA 


ACTAACACTT 


TTATTTTAGG 


CATCACAGGC 


CCAACAAGTC 


TTGTCGTCAT 


TAGCATTATC 


GCTTTAATTA 


TTTTTGGTCC 


GAAAAAATTA 


CCACAATTTG 
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30 



35 



SO 



AGTCTCACGA TACACCCAGT AAGGAATCGA AACAACAGCG AGAGCAATAG CACTGACCAC 96 o 

ACCTTACTGG TTCACTTTAG CGAACTACGC CATCGGTTAG TAAAAATTTT ATTGTCGTTC 1020 

GTCATTACGG TCATCGTCGT ATATGTyTCA TCATTTTGGT GGATGACACC ATTCATAACG 1080 

TATATyACCC GgCACATGTG TcCTTACATG CATTTcATTC ACAGAAATGA TACAAATAAC 114 0 
GTG 

(2) INFORMATION FOR SEQ ID NO: 152: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7953 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 
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1143 



20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 152: 

CAACGCCTGA ACGTAAACCA TATCGTTTCG CGATTTCCTC AT CTTGACT A TTTACTAAAA 60 

ACTCTCTCAT GGCGATTAAT GTTTCTTTTT CTTCTTTAGT TAATGGTAAT TCTAACTCAG 120 

25 CTGCTTTTTG ACGCAAAGTT GGATGACCAT CTCTAATGAT GTCTTTCATT GTTAACATAT 180 

ATTGCACCTT CCTTATTTTA ATTTGTTTTA GTTGAATGAC AGTAAAAAGG TTGTTAAGAT 24 0 

ACTCATACAT TTTTATGTGT AAATATCTAC AAAGTTAACC AACTACTGCC AATGTTTATT 300 

TTAGATAGTA TATGTAAATT TTCAaGAtAT GCgTAATTGC gTTAAAAAAT GaTTAAAGTG 360 

TTGGTTTCAA GCAATGaTAC TTTAGAAATT TATTTATCAT CTTGACTTTA AAAATTATAT 420 

TATAAATGAC GTAACTGTCA ACAGATATAC TTAGTArTGA AGATGTGTAA TGTAATTGTT 480 

TAAAATTGAT TTCCAAGCAG ATTTTATTTA TCATTTAATT TAAATAGCAA GTGGAGGTAC 540 

AAGTAATGAA ATTTGGAAAA ACAATCGCAG TAGTATTAGC ATCTAGTGTC TTGCTTGCAG 600 

GATGTACTAC GGATAAAAAA GAAATTAAGG CATATTTAAA GCAAGTGGAT AAAATTAAAG 660 

40 



ATGATGAAGA ACCAATTAAA ACTGTTGGTA AGAAAATTGC TGAATTAGAT GAGAAAAAGA 720 

AAAAATTAAC TGAAGATGTC AATAGTAAAG ATACAGCAGT TCGCGGTAAA GCAGTAAAGG 780 

45 ATTTAATTAA AAATGCCGAT GATCGTCTAA AGGAATTTGA AAAAGAAGAA GACGCAATTA 840 

AGAAGTCTGA ACAAGACTTT AAGAAAGCAA AAAGTCACGT TGATAACATT GATAATGATG 900 

TTAAACGTAA AGAAGTAAAA CAATTAGATG ATGTATTAAA AGAAAAATAT AAGTTACACA 960 

GTGATTACGC GAAAGCATaT AAAAAGGCTG TAAACTCAGA GAAAACATTA TTTAAATATT 1020 

TAAATCAAAA TGACGCGACA CAACAAGGTG TTAACGAAAA ATCAwAAGCA ATAGAACAGA 1080 
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AAGAAAAGCA AGACGTTGAT CAATTTAAAT AATTAATATA ATACAGATGG TAGGAAACAA 1200 

CTAATACAGT TCCTATTATC TGTATCTTTT TTTATTAAAA CAGAACTTTT TCAAATGGTT 1260 

TAACAGTCCC ATTTATTTGT GGTACAATTA GTAAGGATAA AATGAATTTC TATACAATTA 1320 

TGGGAAAGGT ATTGTGAATT GAATGGCTCC TAAGTTACAA GCCCAATTCG ATG CAGTAAA 1380 

AGTTTTAAAT GATACTCAAT CGAAATTTGA AATGGTTCAA ATTTTGGATG AGAATGGTAA 1440 

CGTCGTAAAT GAAGACTTAG TACCTGATCT TACGGATGAA CAATTAGTGG AATTAATGGA 1500 

AAGAATGGTA TGGACTCGTA TCCTTGATCA ACGTTCTATC TCATTAAACA GACAAGGACG 1560 

TTTAGGTTTC TATGCACCAA CTGCTGGTCA AGAAGCATCA CAATTAGCGT CACAATACGC 1620 

TTTAGAAAAA GAAGATTACA TTTTACCGGG ATACAGAGAT GTTCCTCAAA TTATTTGGCA 1680 

TGGTTTACCA TTAACTGAAG CTTTCTTATT CTCAAGAGGT CACTTCAAAG GAAATCAATT 174 0 

20 CCCTGAAGGC GTTAATGCAT TAAGCCCACA AATTATTATC GGTGCACAAT ACATTCAAGC 1800 

TGCTGGTGTT GCATTTGCAC TTAAAAAACG TGGTAAAAAT GCAGTTGCAA TCACTTACAC 1860 

TGGTGACGGT GGTTCTTCAC AAGGTGATTT CTACGAaGGT ATTAACTTTG CAGCAGCTTA 1920 

25 TAAAGCACCT GCAATTTTCG TTATTCAAAA CAATAACTAT GCAATTTCAA CACCAAGAAG 1980 

CAAGCAAACT GCTGCTG AAA CATTAGCTCA AAAAGCAATT GCTGTAGGTA TTCCTGGTAT 2040 

CCAAGTTGAT GGTATGGATG CGTTAgcTGT nATATCAAGC AACTAAAGAA GCACGTGACC 2100 

GCGCAgTTGC AGGTGAAGGT CCAACATTAA TTGAAACTAT GACATATCGT TATGGTCCTC 2160 

ATACAATGGC TGGTGACGAT CCAACTCGTT ACAGAACTTC AGACGAAGAT GCTGAATGGG 2220 

AGAAAAAAGA CCCATTAGTA CGTTTCCGTA AATTCCTTGA AAACAAAGGT TTATGGAATG 22 80 

AAGACAAAGA AAATGAAGTT ATTGAACGTG CAAAAGCTGA TATTAAAGCA GCAATTAAAG 2340 

AGGCTGATAA CACTGAAAAA CAAACTGTTA CTTCTCTAAT GGAAATTATG TATGAAGATA 2400 

TGCCTCAAAA CTTAGCAGAA CAATATGAAA TTTACAAAGA GAAGGAGTCG AAGTAAGCCA 24 60 

TGGCACAAAT GACAATGGTT CAAGCGATTA ATGATGCGCT TAAAACTGAA CTTAAAAATG 2520 

AC CAAGATGT TTTAATTTTT GGTGAAGACG TTGGTGTTAA CGGCGGTGTT TTCCGTGTTA 2580 

45 CTGAAGGACT ACAAAAAGAA TTTGGTGAAG ATAGAGTATT CGATACACCT TTAGCTGAAT 264 0 

CAGGTATTGG TGGTTT AG CG ATGGGTCTTG CAGTTGAAGG ATTCCGTCCG GTTATGGAAG 2700 

TACAATTCTT AGGTTTCGTA TTCGAAGTAT TTGATGCGAT TGCTGGACAA ATTGCACGTA 276 0 

50 CTCGTTTCCG TTCAGGCGGT ACTAAAACTG CACCTGTAAC AATT CGTAGC CCATTTGGTG 282 0 

GTGGCGTACA CACACCAGAA TTACACGCAG ATAACTTAGA AGGTATTTTA GCTCAATCTC 2 880 
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CTATTAGAAG 




w X CGTATACT 


TAGAGCATAT 


GAAATTGTAT 


CGTTCATTCC 


3000 




GTGAAGAAGT 


ACCTHAACIA A 


UAA1A1ALAA 


TTGACATTGG 


TAAGGCTAAT 


GTGAAaAAAG 


3060 


5 


AAGGTAATGA 


CATTTCVAATY"* 


A X LAUA lnWv 


v» TOCAATGGT 


TCAAGAATCA 


ATGAAAGCTG 


3120 




CAGAAGAACT 


TGAAAAAGAT 


w 1 X A X 1L x v* 


ttgaagtaat 


TGACTTACGT 


ACTGTTCAAC 


3180 


10 


CAATCGATGT 


TGA^ArivATT 
iunvjiLnnl X 


w X AvjV— X X L_AL> 


•T w "V^ A A A A A "t y*^ 

TTGAAAAAAC 


TGGTCGTGCA 


GTTGTAGTTC 


3240 


AAfJAAnCA f*A 


AV_ij x L^MAvjv^ x 


GGTGTTGGTG 


CAG CAGTTGT 


AGCTGAATTA 


AGTGAACGTG 


3300 






AX XAwviuwi 


CCTATTGGAA 


GAGTTG CAGC 


AG CAG AT ACA 


ATTTATCCAT 


3360 


IS 




X uAAAA IvjH 


XGGiiACCAA 


acaaaaatga 


CATCATCGAA 


AAAGCAAAAG 


3420 




nnnL 1 1 X #\ItM, 


AX X 1 1AAIAL. 


A < 1 M 1 M 1 Mil A A A A /"^ 

ATTTTAAAAG 


TTAACGAAGT 


TAGCGTATTT 


TAGTCTCATT 


3480 




wii XivvvilAj 


AAATvjX X XAA 


M'M IWII X AAA 

TTTACGAAAT 


CTTAGGAGGG 


CAAAAACGTG 


GCATTTGAAT 


3540 


20 


1 liiunl X-nV^V.. 


1-ljAX AX VJVjijvy 


GAAGGTATCC 


ACGAAGGTGA 


AATTGTAAAA 


TGGTTTGTTA 


3600 




/vvjU X uuAOA 


XAu X Ax X\sAA 


/** A A /"* A /"I/"* A TV 

GAAGACGATG 


TTTTAGCTGA 


GGTACAAAAC 


GATAAATCAG 


3660 




TRi'^TR/" TV RAT' 


CCCATCACCA 


GCATCTGGTA 


CTGTAGAAGA AGTTATGGTA 


GAAGAAGGTA 


3720. 




UVj X Av>\. 1 Vj 1 


A(j X x GGTGAC 


GTTATTGTTA 


AAATCGATGC 


ACCTGATQCA 


GAAGATATGC 


3780 




A B*P^^A A A 

nni i X Afwvju 


"Pf* A 'Pi'*' A <TV ' TV "T* 

x UATvjATGAT 


GATT CATCAT 


CTAAAGAAGA 


ACCTGCGAAA 


GAGGAAGCGC 


3840 






AbuACCTGTA 


GCTACTCAAA 


CTGAAGAAGT 


AGATGAAAAC 


AGAACTGTTA 


3900 


30 


a ariPZi. iT^rr 

nnlaWWi X *j v— 


X 1 wAVj X AL.Q-/T 


AAA T^A /"«.^~» Tt <»n 

AAATAC GCAC 


GTGAAAAAGG 


TGTTAACATT 


AAAGCAGTTT 


3960 






1 AAAAA X vj\iT 


CGTATTACAA 


AAGAAGATGT 


AGATGCATAC 


TTAAATGGTG 


4020 


3S 




Aov I X U^AAT 


GAATCAGCTG 


CTTCAGCTAC 


AAGTGAAGAA 


GTTGCTGAAA 


4080 


X X krV_nuVw 


A r^rrnf* & ■p*/** n. 
AL.U XuriJASGA 


/■WW* a A 1 1 ■ 1 > ~\ /■<« 

GTAACATTAG 


AAGGCGACTT 


CCCAGAAACA 


ACTGAAAAAA 


4140 






f2 f^f^T AT"* & P* .f 14 


A i|M|V » A A A ^ 

ATTGvJGAAAG 


CAATGGTTAA 


CTCTAAG CAT 


ACTGCACCTC 


4200 


40 


A "TV"?^ TV A ^ A* 1*1' 
niuliviuril X 


A A TY**/*** A "TV~* A A 


A n M IV * A nv~4T«TV^ 

AI\TGATGTTC 


AAGCATTATG 


GGATCACCGT 


AAGAAATTTA 


4260 








GGTACTAAGT 


TAACATTCTT 


AC CTTATGTT 


GTTAAAGCAC 


4320 




ilVll X WX^fH.- 


Al IsvAAAAAA 


TACCCAGCAC 


TTAACACTTC 


ATTCAATGAA 


GAAGCTGGTG 


4380 


4S 




"T* A A TV /"^ A "T~*T* A /""» 

X AAAUiTTAL 


• IV * /*■• A A A f^f* 

TGGAATATCG 


GTATTGCAGC 


AGACACTGAT 


AGAGGATTAT 


4440 




TAGTACCTGT 


TGTTAAACAT 


GCTGATCGTA 


AGTCTATTTT 


CCAAATTTCA 


GATGAAATTA 


4500 




ATGAATTAGC 


TGTTAAAGCA 


CGTGATGGTA 


AATTAACAGC 


CGATGAAATG 


AAAGGTGCTA 


4560 


SO 


CATGCACAAT 


CAGTAATATC 


GGTTCAGCTG 


GTGGACAATG 


GTTCACTCCA 


GTTATCAATC 


4620 




ACCCAGAAGT 


AGCAATCTTA 


GGAATTGGCC 


GTATTGCTCA 


AAAACCTATC 


GTTAAAGATG 
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ATGGTGCAAC TGGCCAAAAT GCAATGAATC ACATTAAACG TTTATTAAAT AATCCAGAAT 4 800 

TATTATTAAT GGAGGGGTAA AACATGGTAG TTGGAGATTT CCCAATTGAA ACAGATACTA 4 860 

TAGTAATCGG AGCAGGTCCT GGTGGATACG TTGCAGCAAT TCGTGCAGCT CAATTAGGAC 4920 

AAAAAGTAAC AATCGTTGAG AAAGGTAATC TTGGTGGTGT TTGCTTAAAC GTAGGATGTA 498 0 

TTCCTTCAAA AG CATT ACT A CATGCTTCTC ACCGTTTTGT TGAAGCACAA CATTCTGAAA 504 0 

ACTTAGGTGT TATTGCTGAA AGTGTTTCTT TAAACTTCCA AAAAGTTCAA GAATTCAAAT 5100 

CATCAGTTGT TAATAAATTA ACTGGTGGTG TTGAAAGCTT ACTTAAAGGT AACAAAGTTA 516 0 

ACATCGTTAA AGGTGAAGCA TATTTCGTAG ATAACAATAG CTTACGTGTT ATGGACGAAA 5220 

AGAGCGCACA AACATACAAC TTTAAAAATG CAATCATTGC AACAGGTTCA AGACCAATTG 5280 

AAATTCCTAA TTTCAAATTC GGTAAACGTG TTATCGACTC AACAGGTGCT TTAAACTTAC 534 0 

20 AAGAAGTACC aGGTAAATTA GTTGTAGTTG GTGGAGGATA CATTGGATCA GAATTAGGTA 54 00 

CAGCATTTGC TAACTTTGGT TCAGAAGTAA C CAT CCTTGA AGGTGCTAAA GATATCTTAG 5460 

GTGGCTTCGA AAAACAAATG ACACAACCTG TTAAAAAAGG TATGAAAGAA AAAGGTGTTG 5520 

25 AAATCGTTAC TGAAGCTATG GCTAAATCAG CTGAAGAAAC AGATAACGGA GTTAAAGTTA 5580 

CTTATGAAGC TAAAGGCGAA GAGAAAACAA TCGAAGCTGA TTATGTATTA GTAACTGTAG 564 0 

GTCGTCGTCC AAACACAGAC GAATTAGGCC TAGAAGAATT AGGTGTTAAA TTCGCTGACC 5700 

GTGGATTATT AGAAGTTGAT AAACAAAGCC GTACGTCTAT CAGCAATATC TATGCAATTG . 576 0 

GTGATATCGT TCCAGGTTTA CCACTTGCTC ACAAAGCTAG CTATGAAGCT AAAGTTGCTG 5820 

CTGAAGCAAT TGATGGTCAA GCTGCTGAAG TTGATTACAT TGGTATGCCA GCAGTATGCT 5880 

TTACTGAACC AGAATTAGCT ACAGTTGGTT ATTCAGAAGC GCAAGCTAAA GAAGAAGGTT 594 0 

TAGCAATTAA AGCTTCTAAA TTCCCATATG CAGCAAATGG TCGTGCATTA TCATTAGATG 6000 

ATACTAACGG ATTTGTTAAA CTTATTACAC TTAAAGAAGA TGATACTTTA ATCGGTGCTC 6060 

AAGTAGTTGG TACTGGTGCA TCAGATATTA TCTCTGAATT AGGTTTAGCA ATTGAAGCTG 6120 

GTATGAATGC TGAAGATATC GCATTAACAA TCCATGCACA TCCAACATTA GGTGAGATGA 6180 

45 CTATGGAAGC AGCAGAAAAA GCTATCGGAT ACCCAATCCA TACAATGTAA TAACTGATTA 6240 

TCTATAAAGA TTCAGTCATT AAAAGCTGTA GCATATGCTA CGGCTTTTTT GTTTTAGGTA 6300 

AAGTAATGTA AGGAAATTGA TTTGAGATAT CGTTAACATG TGACATGCAT GTTATACTAG 6 360 

50 CGATGCTAAT AAAAGAATTG AAATGGAGGG TTCAACAATG GAATATGAGT ATCCAATTGA 64 20 

TTTAGACTGG AGTAATGAAG AGATGATTTC AGTGATAAAT TTCTTTAATC ATGTAGAGAA 64 8 0 
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AATTGTGCCT GCTAAAGCAG AGGAAAAACA AATTTTTAAT ACTTTCGAAA AAAGTAGTGG " 660( 

CTATAATAGT TACAAAGCAG TTCAAGATGT AAAAACTCAC TCTGAAGAAC AAAGAGTAAC 6 66C 

AGCTAAAnAA TAATTCGTTC GAAATTAACA CAATTTAATA GGAATTTTTC TTTAAAACTA 672C 

TTGCTAATAA AGCTATATTT TGATACCTTT ATCAAGTGTT AAACAAAATG TTTGATAAAA 678c 

GTAAACTTAA TATAGCTTTT TTAGGTGGAA AAATAAATGA ACATAGGTAA TAAAATTAAA 684C 

AATCTTAGAA GAATTAAAAA TTTAACGCAA GAAGAACTTG CTGAACGTAC AGACTTATCG 6900 

AAAGGCTACA TTTCACAAAT AGAAAGTGAA CATGCCTCAC CAAGTATGGA AACTTTCTTA 6960 

, s AATATTATAG AGGTGTTAGG AACGACGCCA AGTGAATTTT TTAAAGACAG TGAAAATGAA 7020 

AAAGTATTAT ACAAGAAGGA AGAACAAGTT ATTTATGATG AGTATGATGA AGGTTATATA 7080 

TTAAATTGGT TAGTTTCAAA GTCAAATGAA TATGATATGG AGCCATTAAT ATTAACTTTA 714 0 

20 AAGCCTGGAG CAT CATATAA AAATTTTAAT CCATCAGAGT CTGATACGTT TATTTATTGT 7200 

ATGTCAGGTC AGATAACACT TAATTTAGGC AAAGAGATAT ATCAAGCACA AGAAGAAGAC 7260 

GTTTTGTATT TTAAAGCACG AGATAATCAT CGTTTGTCAA ACGAATCAAA CAATGAAACA 7320- 

CGAATACTTA TTGTAGCGAC AGCTTCATAT TTATAGGGGG GATCTTATTT GGAACCGTTA 7380 

TTATCATTAA AATCAGTTAG T AAAAG CT AT GATGATCTTA ATATCTTAGA TGACATAGAT 744 0 

ATTGATATTG AAT CAGGAT A CTTTTATACA TTATTAGGTC CTTCAGGTTG TGGTAAAACA 7500 

ACAATTTTAA AATTAATTGC AGGGTTTGAA TATCCTGACA GTGGTGAAGT GATTTATCAA 7560 

AACAAACCAA TTGGTAATTT ACCACCAAAT AAACGTAAAG TGAATACAGT CTTTCAAGAT 7620 

TATGCATTAT TTCCACACTT AAACGTCTAT GATAATATCG CTTTTGGTTT GAAATTAAAA 7680 

AAATTATCAA AAACCGAAAT TGATCAAAAA GTAACTGAGG CATTAAAATT AGTAAAACTT 774 0 

TCAGGTTATG AAAAAAGAAA TATTAATGAA ATGAGTGGCG GACAAAAGCA ACGTGTTGCA 7800 

40 ATTGCACGTG CTATCGTAAA TGAACCAGAA ATATTATTGT TAGATGAATC TTTATCCGCA 7860 



25 



JO 



35 



TTAGATTTGA ^lATTGCGTAC TGAAATGCAA TATGAATTAC GAGAATTGCa ATCTAGATTA 

GGtATTACAT TTATATTTGT aACACATGAT CCA 

45 (2) INFORMATION FOR SEQ ID NO: 153: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2347 base pairs 
.(B) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
50 (D) TOPOLOGY: linear 



7920 
7953 



55 



BNSOOCID: <£P 0786519A2_I_> 



774 



EP0 786 519 A2 

GGCGTGATCA TACGACCGTC ATTCATGCTC ATGAAAAAAT ATCTAAAGAT TTAAAAGAAG CO 

ATCCTATTTT TAAACAAGAA GTAGAGAATC TTGAAAAAGA AATAAGAAAT GTATAAGTAG 120 

5 GAAACTTTGG GAAATGTAAT CTGTTATATA ACAGCACTAA TGATnACAAT CATTTTTTAC 180 

ATTTCTATAT GCTAATGTGG CAAGATGAGC AAAACTCATT TTGTGGATaA TGTTTaAAAG 24 0 

TCATACACAC CATACACAAG TTATCAACAT GTGTATAAyT cGcCAAATCT ATGTTTTTAA 300 

10 

GACTTATCCA CCAATCCACA GCACCTACTA CTATTACTAA GAACTTAAAA CCTATATAAT 3 60 

TATATATAAA CGACTGGAAG GAGTTTTAAT TAATGATGGA ATTcACTATT AAAAGAGATT 420 

ATTTTATTAC ACAATTaAAT GACACATTAA AAGCTATTTC ACCAAGaACA ACATTACCTA 4 80 

15 

TATTAACTGG TATCAAAATC GATGCGAAAG AACATGAAGT TATATTaACT GGTTCAGACT 54 0 

CTGAAATTTC AATAGAAATC ACTATTCCTA AAACTGTAGA TGGCGAAGAT ATTGTCAATA 600 

20 TTTCAGAAAC AGGCTCAGTA GTACTTCCTG GACGATTCTT TG TTGAT ATT ATAAAAAAAT 660 

TACCTGGTAA AGATGTTAAA TTATCTACAA ATGAACAATT CCAGACATTA ATTACATCAG 720 

GTCATTCTGA ATTTAATTTA AGTGG CTTAG ATCCAGATCA ATATCCTTTA TTACCTCAAG 780 

2S TTTCTAGAGA TGACGCAATT CAATTGTCGG TAAAAGTGCT TAAAAACGTG ATTGCACAAA 840 

CAAATTTTGC AGTGTCCAcC TCAGAAACAC GCCCAGTACT AACTGGTGTG AACTGGCTTA 900 
TACAAGAAAA TGAATTAATA TGCACAGCGA CTGACTCACA CCGCTTGGCT GTAAGAAAGT 960 

30 

TGCAGTTAGA AGATGTTTCT GAAAACAAAA ATGTCATCAT TCCAGGTAAG GCTTTAGCTG 102 0 

AATTAAATAA AATTATGTCT GACAATGAAG AAGACATTGA TATCTTCTTT GCTTCAAACC 1080 

AAGTTTTATT TAAAGTTGGA AATGTGAACT TTATTTCTCG ATTATTAGAA GGACATTATC 1140 

35 

CTGATACAAC ACGTTTATTC CCTGAAAACT ATGAAATTAA ATTAAGTATA GACAATGGGG 1200 

AGT7TTATCA TGCGATTGAT CGTGCCTCTT TATTAGCGCG TGAAGGTGGT AATAACGTTA 1260 

TTAAATTAAG TACAGGTGAT GACGTTGTTG AATTGTCTTC TACATCACCA GAAATTGGTA 1320 

40 

CTGTAAAAGA AGAAGTTGAT GCAAACGATG TTGAAGGTGG TAGCCTGAAA ATTTCATTCA 13 80 

ACTCTAAATA TATGATGGAT GCTTTAAAAG CAATCGATAA TGATGAGGTT GAAGTTGAAT 144 0 

45 TCTTCGGTAC AATGAAACCA TTTATTCTAA AACCAAAAGG TGACGACTCG GTAACGCAAT 1500 

TAATTTTACC AATCAGAACT TACTAAAAAT AAATATAAAT AAAGGATGAC GTGATTAATT 1560 

AAAACGTCAT CCTTTATTTT TTGGCAAAAA TAATTCTAGG TGCGTATGTA AAATAAATTT 1620 

50 GGCAGCATTT TAAACAGCAA ATAAAAGACG CCAATTAAAT TTATGACAAA TGTATCCAAA 1680 

ATTTAATAAG TGTGCTTATA TGCCCTTTAA ATTTAAAATT TTAATAGTCA ATAACAAGTT 174 0 

55 
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AAAAATAAGA ATTAATTATT TATATGTAAA CGGTTTCTAC CTCTATTTTA AATGAAATTT i860 

GTGACAAAAA AAGGTATAAT ATATTAATGA CATACAAAGA AATGGAGTGA TTATTTTGGT 1920 

5 

TCAAGAAGTT GTAGTAGAAG GAGACATTAA TTTAGGTCAA TTTCTAAAAA CAGAAGGGAT 1980 

TATTGAATCT GGTGGTCAAG CAAAATGGTT CTTGCAAGAC GTTGAAGTAT TAATTAATGG 204 0 

AGTGCGTGAA ACACGTCGCG GTAAAAAGTT AGAACATCAA GATCGTATAG ATATCCCAGA 2100 

10 

ATTACCTGAA GATGCTGGTT CTTTCTTAAT CATTCATCAA GGTGAACAAT GAAGTTAAAT 216 0 

ACACTCCAAT TAGAAAATTA TCGTAACTAT GATGAGGTTA CGTTGAAATG TCATCCTGAC 2220 

i$ GTGAATATCC TCATTGGAGA AAATGCACAA GGGAAAGACA AATTTACTTG GAATCAATTT 2280 

ATACCTTAGC TTTAGCAAAA AGTCATAGAA CGAGTAATGG ATAAGGGACT CCATACCGTT 234 0 

TTAATGC 2347 

20 (2) INFORMATION FOR SEQ ID NO: 154: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13 542 base pairs ' 
<B) TYPE: nucleic acid 
(C) STRANDEDNESS: double 
25 (D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 154: 

30 



3S 



40 



ACAAGACGTn 


TCTATAACTT 


ATCTGAAATC 


GCTCGTCAAG 


ATAAAGATTA 


TGCAACTATC 


60 


TCATTCTTAA 


ACTGGTTCTT 


AGATGAACAA 


GTCGAAGAAG 


AATCAATGTT 


TGAAACTCAC 


120 


ATCAATTATT 


TAACTCGTAT 


CGGCGATGAC 


AGCAATGCAT 


TATATCTTTA 


CGAAAAAGAA 


180 


CTTGGCGCTC 


GTACATTCGA 


CGAAGAATAA 


TTAAACATCA 


CTACAATAGA 


CAGATAAATA 


240 


TCATACGACA 


TGATAGGCAT 


TTGGGTCACT 


TACAATAACC 


CAATGTCTAT 


ATTATTTTGC 


300 


TTTACGGAGA TCACTAGATT 


CATTTTCTGA 


ATCATTGATC 


TGCGTTTTTT 


CATTTTCAAG 


360 


GCTAATTATT 


gtaittttag 


TCATTTATTT 


TTTAAACTAC 


TAATGTTAAT 


AACTCTAAAT 


420 


TTGATGTTGA 


ATTAATTTGA 


CGATTTTAAA 


GCATATCATC 


ATTTACTTTT 


TAATCAGAGT 


480 


TACATCCAAA 


TGATAGATTT 


CACGTTATAC 


CTTCACGTAT 


AATATTATGT 


ATCGTTTGTA 


54 0 


AGCAAATGAC 


TAAAAGTCTA 


TTAATATATA 


CATTTAATTA 


ATTGAAAGGA 


TTGACTACAT 


600 


GATACAAGAT 


GCGTTTGTTG 


CACTTGATTT 


TGAAACAGCA 


AATGGTAAAC 


GTACAAGTAT 


660 


TTGTTCTGTC 


GGAATGGTTA 


AAGTCATTGA 


TAGTCAAATA 


ACAGAAACAT 


TTCATACTCT 


720 


TGTGAATCCG 


CAAGACTATT 


TTTCACAACA 


AAATATTAAA 


ATTCATGGCA 


TACAACCAGA 


780 
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aGATTTACCT GTTGTCGCAC ATAACGCGGC 
TCAAAATATT GGTTTACCAA CTCCAAATTT 
5 AAGAACCGTT GATTCGTATC GATACGGTTT 

TTTTCATGGT CATCATGATG CATTGAATGA 
GCTACTGAAA AATTATGAAA ATTTAACATA 

10 

AGATAAAGGC TAGGACTAAA TAAAATACTC 
ACTTTGCAGG GAGCTTTATT TTATATAAAG 
TGTTCTAAAT TACCTACAGT GACACCAATA 
TCGTTATAAA GTAAATATGC AATATTATAA 
AAACTCATCT GTTTAGATAG CGTTTCAAAT 

20 TTAG CTGACT TCTGTAATTT ATTTAGACGT 

TTTTCTTAAA ATCTCTT CAT CATCATTCAC 
TGATTTTCTT ACTCTTGATG ATTTCACTTC 

25 TAAACCCCGA CCTCTTTTTC CAAACAAACG 

ATCTCTACCG TTAAAAATAC CATTATCATG 
TGGaAAATCT CCAATATCCA ATGTCATCAA 

30 AGTCATACCA TCAGGTTTAT T CAT AC CACT 

AACACCTGCA GATGCTGTTA AATGTGTCTG 
AATTTTCGAA GCAGGAAGGT CTGGTCTCAC 

35 

CAATGACATC GGTTCTACCT TATCTGTATA 
TGTTTCTCGG TAAGCACCAA AATTACTTGT 
CGCTTGTGAC ATAGGCATTG CTGAATGGAC 

40 

AGAGACAACA CCCCTACTGC TTGCTTTACC 
GGGGTTATCT CTCATTTCGA CTTGTGCAAA 

4S TCTCTCAGTC AAGTGCTCAC CTCCCTACTA 

TCAACATAAT TATACGCTGT GTACGATTTT 
ATATTGaGAT AACTACAAGT TGTTATaAAA 

50 CGATTGAGTA AGAAAACATA GGTAATCTGA 

TCATCATATT AAAATTTATT ATTGAGTCGG 

55 



ATTTGATATG AACGTCTTAC ATCAAAGCAT 900 

AACTTACTTT TGTAGTTATC AACTTGCTAA 960 

AAAACATATG ATGGAGTTTT ATCAATTAGA 1020 

TGCCAAAGCA TGCGCAATGA TTACTTTTAG 1080 

TGTAACTAAT ATTTATGGTA AAAATCTAAA 1140 

CCTTCAAAAG TAAGCATTGT AAAAATGTAA 1200 

TCATATATCG TCATATTTTT ATAAGTTGAT 1260 

AGTCGAATTG GTACATCAGG GTCTTTTAAA 1320 

ATATCTTCTT CAGAACTAAC CGAATCTCTT 13 BO 

TGATAAGTTT TAATTTTAAC CGTTACAGTT 144 0 

TCAGCTGTTT TACCTGnACA ATTCCCATAC 1500 

GTCTGTTGCA AATGTGCGTT CAGTCCCTAC 1560 

ACTATGGTCA ATACCGCGTG CCTTGTTATA 1620 

TATTAATTCA AATTCCGTTT TCTCATATAA 1680 

CATTACTTTT TTGGAAGCTT TACCTACGCC 174 0 

AATATCATGG aCATTTTGAT AATCAATCAC 1800 

CGCTAATTTA GCTAAAAATT TGTTATAAGA 1860 

CTCTAGAATA TCTTTTCTAA TATACTGAGC 1920 

TAATTCTGTA ATATCTAAAT ACGCTTCATC 1980 

ACTTCGGAAA ATAGACATAA TCTGCGCAGA 2040 

GACAAAGTAT CCATTTGGAC ATAATTTATG 2100 

GCCGTATTTT. CGTGCTTCAT AGGATGCCGT 2160 

ACCAACAATG ACTGGTTTCC CTTTCAATTT 2220 

AAAATAGTCC ATATCTATAT GAATAATTCG 2280 

ATTTTTACTT TTATAACGCA CAAAAATATC 2340 

TTTACATAAA TCTTGCACTT AGCGATAACT 24 00 

TCAATTGCTA TTTAAGCATG ATGATGAAGA 24 60 

AATAATTCAA GCAAATTCAT TTTGTTGGTA 2520 

CTTTTGATGA TACAAATAAA TACTATCTTC 2580 
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AAAGCAATAA 


G CGGTATGCA 


TAf*TA A AO AT 
X aV*. X aaaV-a X 


& A A. & A *T* A A 

nnAAAlAAu 1 


is »l V • TS IS +T+tk 

UATGAATAAC 


CAAATACCTT 


2700 




AATTAAAATA 


AGCAAGCCAG 


TAtTTAATAG 

X AV« X X AA X AO 


v»Al lAuluul 


ft ^*ft /^^>IS TS1S » 

LaADAU CJATAA 


fTC Ik l^l^^^ IS ^ IS IS 

TAATTGAGAA 


2760 


5 


TTGCCATTTG 


TTGAAGCAAG 


OATfTGf^TGT 

Wt X V X W X V* X 


TTG/2A1VTA110 


ATTCTGTCTT 


i"l 1 1 l AT ATT 


2820 




AAACATAGGT 


TTHfTATrTT 

A X X X V» X X 


XXX 1 aaaIaa 


A A A A AH? ft A «ti 
A/ibAAAi AAT 


GCTCTATGGA 


TAAGTT CATG 


2880 


10 


TAAAATCAAT 


AAAATAATGA 


ATPPAGPAAA 




ft ft. ttt" is nr^» is 
AvjAI ivjATGA 


TGATATTTTG 


2940 


ATCGACAAC C 


GCTGTGACAP 




v. 1 lAlAwlA 


ft ft T ft ft ft ft T*/^ A 

AATAAAATCA 


f^f* IS IS T» IS IS f^/^ /~» 

CGAATAACGC 


3000 




AATAACAAGT 


TG CAAGATAA 

a. siunnun X aa 


TA A &r<TTfT 

X AAA\_V_ X 1 ^—VJ 


V-A 1 1 lwW\A 


1 1 A 1 1 Cvj 


TTAAATCAAT 


3060 


15 


TTTATGCATT 


ACCAACCCTC 


CCGATCATGA 


CATTCTTATT 


CTTCTTTAAA 


TATAGTATAC 


3120 




AAX w X V_4%4_A X 


TTA iTTTi ft. A 


ft A/^'lT^ftTft T* 

AAu x 1 Wl 1 AT 


fft A/"* IS. n TV IS 

LAAGAAAGTA 


aattggctgt 


AATAAAATTT 


3180 




T AAT A T APR & 




\JAt- 1 1A1 1AA 


Af"' A A IS IIHIMII 

GGCGAAATTT 


TATCtCAAAT 


CATGTGCGCT 


3240 


20 


AX X X U/WM X 


G2V ATA tTrtPr 1 


AC 1 v» 1 WX LAA 


t-ATGTGl 1GT 


ttgtggaaac 


ATATCTACCG 


3300 




vjlvJi X nUV. X \v 


X X Lnnu X X 


1 A l~l~l~l~ruAG 


r**T* T\ A T*ft ft»T*A is 

CTAATAATAA 


TG CATCACGT 


TGCTGTGTTG 


3360 




PGGG ATT A C A 
v>vjVMni xav_a 


TGAAATATAO 
X unnn X a X Av» 


AUv\ 1 AUVsv* 1 


TAGGTTCTAA 


fly im« IS^^^S is is 

TGTAAGCAAA 


GTCTGAATAA 


3420 


25 


X "X X WVl x \— 


a*»asjv.v~\_ 111 


^^^^^P^^^^ ^^^^^^ R 

v- x lG%jv-VjrviAi 


UtACLA 11 AC 


AACATCTGGT 


TTAATCCCTT 


3480 




Vj X OU XXX V-.V^~f\ 


X lulAMAnln 


AL \JAG 


CTTTCCCACA 


IS is is is is Mmm 

GACAAAAGTT 


GTATTATTGC 


3S40 




ax x w\2 x x ini 


AVflwWil 1 1 


1 vj 1 IvjIGUGI 


CTTCAATTGC 


AGAAGGTACT 


ACTTCAACAC 


3600 


30 


CGT ATA f A 

V— O 1 a X nWi X vj 


111 ivjLAAvj 1 


GVjTGC CAT AT 


ATAGC CC7TAT 


TGTTCCAATA 


CCACAATAGG 


3660 




TATCTAATAC 


AACTTCATTA 






AATTGCTTTA 


TTATATAATT 


3720 


35 


TCTCTGTTTG 


TTCAGAATTA 


ATTTGGTAGA 


ATGACTGATC 


ACTTATTTTA 


AATGTACTAT 


3780 


LWrrAATTG 


ATCAATAATT 


V» 1 A ± \_ 1 l 1AU 


L-A 1 Al Ai?C GT 


•¥» ft HP ft /"» ft. *T**TV* ft 

1 ATAGAl IviA 


^n^*^*^* is wis is 

CGTCCCATAA 


3840 




TAACATTAGA GTGGCTATCA 


1 1 aaI V? 1 111 


ull lAnluV. 1 


TGTCACATTA 


/"*/^ 7S |S IS T»»*^ ^ 7S T« 

GGAAATGCAT 


3900 


40 


CTAATATCTT 


CTCAACAACA 


wUil 111111 


G lTJGw\-Av, 1 1 


TTTACCATTA 


/'MIMIt «k M« ft IS IS IS 

GTTACAAAAA 


3960 




TAATCATCAT 


TTCGTCTGTA 


luniAlLUlu 


1 1 L. 1 x ALAAv. 


ft ft ft nv , n | p | r^ 
CAAATuTwTW 


ft 1**P|S IS IS MMftwii 

ATTAAACCTT 


4020 




TTTTCAATTG 


TTCTTGATAA 


nlAV. 1 lAWii 


TTAAATCTTT 


T^ft ft ft is n*ft ft 
TAAAATAGAT 


TTAACTTCAT 


4060 


45 


TCATCACTTC 


TTGATGTTGT 


VjaA 1 L. 1 IXj 1 A 


1 1 AAALAALi 


11C v»aTGTCA 


ft*rtis K«ry<>TVnmi 
ATAATGTCAT 


4 140 




GGCTTCTTTG 


ACGATAAAAG 


CCCATAATAA 


CTTCATTCTG 


TTCATTCTTA 


CCAACTGGAA 


4200 




TCTGGGACTT 


GTTT CGATAT 


CTCCAAGGAT 


CTGTCATGCC 


AACTGTATCG 


TTAATCTTAG 


4260 


SO 


AATTATCAAA 


ATGCGCTTTT 


CGCTGAAACA 


AATTAATCAC 


TTGTTCCTTT 


TTCATTTCAA 


4320 




GTTGTGCTTC 


GTATGATAAG 


TGTTGAAGTT 


GGCACCCACC 


ACAACGTTCA 


TAATATATAC 


4380 



55 



BNSDOCID: <EP 078651 9A2_I_> 



778 



10 



15 



20 



EP0 786 519 A2 

AGTTCTTTTT TACTTTGATA ATTTTATATT CAATTTGTTC ATTAATTAAA GCTTGTGGTA 4 500 

TGAAAATAGG AAAGCGATCT ATTTTTACGA CACCATGGCC TTCATGCGTT AAATCAACAA 4 560 

CTGTTCCCGT TTTTATGTCA TTTTT AG CT A TTGCTTGCAA AATTT T ACCT CCAAAATGAA 4620 

CAGGTTAGGA ACAAAATTAT GCGCTTCCTA ACCTGCCATT ATATATTTCA CTATTTCTGT 4 680 

TTATTCTTCG ATTAAATTGT CATCAACATG AT CATT ATTT ATTAACTCTT CATTTACAAT 4 740 

ATCATTAGGT GCAAAGACAT CTATATGACG TT CT AG ATTT AAGAAATTCG CTGGTAATTT 4 800 

ACCACCATAT TCTCCATCTA CATTTAGTTG TAAGTCTGTG AATGATGAAA TATTAATTGC 4 860 

CTTTGCTTTT TCATAAATAA CTTTAGGATG CTTAGTATGT TCTCCTCTTG AAGCTAAAGT 4 920 

CATAATATGA CCAAGTTCTG CAAGGTTTGA TTTTTCAACT ATAATTAACG TAAAATAGCC 4 960 

GTCATCTAAC TTAGCGTCCG GCACTAATTT TTCAAATCCT GCCATTGAAT TTGTTAAACC 5040 

TAAAAAGAAT AATAATGCTT CTCCTTGGAA AACATTACCA TCATATTCAA TTCTTAAATC 5100 

TACAGCTTTC ATTTGAGGTA ACATTTCGAA ACCTTTGaTG TAATAAGCAA ATGGACCAAC 5160 

AATAGATTTC AATTTACTCG GTGTTTCATA AGAGACTTGC GTCAATTGTC CGCCTGCAGC 5220 

25 TAAATTAATA AAGTATCGAT TATTCATTTT ACCAATATCT ACTTTAGTAG AATGACCTTC 5280 

AATGATGACA TCAAGTGCCC CCATGATGTC ATTAGGTATA TGCAATGCAC GTCCAAAGTC 534 0 

ATTAACAGTA CCCATAGGAA TGACAC CT AG CTTAGGACGA TTAGGCTTTT CTGCGATACC 54 00 

30 ATTAACTACT TCATTTAATG TTCCATCACC ACCTGCAGCG ATT AAT A CAT CATAATTTTC 54 6 0 

ATGCATAGCT CTTTCTGCTT CAAGTGTGGC ATCACCTATT TTCTCGGTTG CATATGCACT 5520 

CGTTTCATAT CCCGCTTTTT CTAATTTTAT TAAGGCATCA GGTAATT CTC TTTTAAATAG 5580 

CTCTTTACCT GATGTCGGGT TATAAATGAT TCTAGCACGT TTCCTCATAT CTTATCCCTC 5640 

TACTTAAAAT TCATATATTT TAACTTCATC TTTGTTTCGT CTAATAGGGA GTGGGACAGA 5700 

AATAATATTT AACAAAATTT ATTTCGTTCT ACCCCAACTT GCATTGTCTG TAGAATTTCC 5760 

TTTCGAAATT CTCTATGTTG GGGCCCCACC CCAACTTGCA CATTATTGt A AGcTGACAGA 5820 

AAGTCAGCTT CTTTGTTTGG GGGCCCCGCC AACTTGCACA TTATTGTAAG CTGACAGAAA 58 80 

ATCAGCTTCT ATGTTGGGGC CCCACTAGAA TTGAAAAAAG CTTGTTACAA GCGTATTTTC 594 0 

TTTCAGTCAA CTACAGCCAA TATAACATTG TAGTGCCTAG GACATTGAAT TTATGACCCA 6000 

GGCTCAGTCT TATTT CATCA TTCTTAATAT CGTTAAAGAC CAACTTGTAT CTTAAACAAA 6060 

50 TACTATCTCA ATATGTACAA AGCTTGTTAT TTATTCAGCA TTTTTTGCCG TTCTTCATTA 612 0 

TAtAGcTTCG TCAGTTATGC TATTTTACCT TTAAAATGAT GTTGTAAATA TAATGTTGTC 6180 
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40 
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50 



AACGCATTAA 

AATTTGACTT 

TTATTTTTTA 

AATAGTTGAT 

ACTAAGAAGC 

TTGTCTAATG 

C CATT AT CTT 

TTCTTCGCAA 

TTTTCTGGTG 

ACGCCACCCA 

TCAAAGAAAT 

CCTAATT CAT 

A CACGCT CTT 

CGGTAATCAT 

AATCGACGTG 

T CTTCATATT 

TT AGT AC CAA 

GATCCCTCTT 

TCTAAATATG 

AGCGGTGTAC 

CCAGCATCTT 

TCGATATCGA 

TTTGGATTAT 

ATATTTAGTG 

AAGACACCTG 

TGCGCTGGTG 

CCTATAACTG 

AAATTGTATT 

TTACCAATGA 



TAAAATTAAT 
CTATAGATAT 
AATCTTCATA 
TTACTAATTG 
C CAT AGCTTT 
CTTCATTTAC 
CCATAATCTG 
TTTTACTGCT 
TTAATTTAGT 
TTAACCAGTT 
CTGACATTTC 
TTACATACTT 
TCCAAGCATC 
CAGAACCTTC 
TTTCTTGTCC 
CTAAACCTTT 
ATTTTTCTTG 
CCATCTTAAC 
CATATGCTTC 
CTTGACGGTT 
CTTCCATGTG 
TATATCCATT 
CTGGATAGAA 
CCATTGCAGC 
GATATGCTAA 
ATGGAGAAAA 
TTTCAAAATG 
GTGTTTCATA 
ACTGTAAACC 



ATTTTTACCA 
AAATAAACCC 
GTTTGATGAT 
TGGATTAGCT 
GCCTTTACCA 
AAATTTTAGA 
TTTAGCATTA 
CATTGTTCCG 
ATCTAATAAT 
AGATGTTAAT 
TTTAGTCAAT 
AGCTTTACGT 
ATCAATATAT 
TTTAACACGC 
GATTTCTCCA 
ACGTACATAG 
ACCATATGGA 
GTCTGATACA 
TTTAGGTGAA 
CAAGTCAACT 
AAGACGAGTA 
TTCACCAATT 
ATAGTTCTTA 
ACGCATTGCC 
GTCGATAACA 
CATTTTTGAG 
CATGATTTCC 
TTGATAAGCG 
GATTGGTCGG 



TTAACATGTA CAATGAATAA 
TCGATTGCAT CTAAGTCAGC 
TTAAATTATC TTTTATCTAA 
TGAC CTTT AG ACGCTTTCAT 
TTTTTGTAAT CTTCAACTGA 
AGTGTTGCTT CATCAGAAAT 
C CAC CTTT AG CTG CTAACTC 
TCTTCGATAA GTTTAAT CAT 
TCTACTTGAT TTTTATTTAA 
TTAACATCTG CACCGTGTTC 
GTTAATACGT GTGCATCGTA 
TCATCTGGTA ATTCAGGAAT 
AAAGGTACAA TGTCAGGCTC 
ATTAAAATTG TTTTACCTGT 
CCATTTAACA ATTCTTCTTC 
TTAAATGAGT TTAAGTTTTT 
CGTAAAGAGA TGTTAGCATC 
C CAGTG T ATT GAATAATTGA 
CGAATATCTG GTTCAGATAC 
AATGAATACT CACCTTTATG 
ATACCGATTC GTTTTGTTTC 
GGTTGATCAA ATTGAGAAAT 



CGGTCAAACT TAGATTCTGT 
CAGTCTACTG CACGCTTATT 
TTTGTATTTG AGTTAGGTTC 
TCCGTTTTTA ACTCTACGTG 
ACTCCTTATA ATTTTTCATA 
ACACGATATA ACGTTTTTTC 
CCATTTGATT GTCCACAAGG 



AGTTAAAAGT 
AATCAAGGGT 
TTCTTGTTTT 
AATTTG AC CA 
TTGTTCGTTA 
TTGAACTAAG 
TGGGAAGACT 
ACCTGCTAAA 
ATATTCGTTT 
AATTGTTGAT 
TGCAGGTAAA 
TGTCTGACGA 
TGGGAAGTAA 
AGATTCATCA 
TTGGCGTTTT 
CAATTCGGCT 
ACAACGTAAA 
ACGCAATTTT 
GATTTCAATT 
TGTTGACTTA 
ACCGTCGACT 
TTGATATGCT 
TGCGATTTCC 
AACAACTGGT 
TGCTCCAAAA 
AACTTCAAGT 
AACGTCATGT 
ATCGAATGGT 
AACAGAAATA 



6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
7560 
7620 
7680 
7740 
7800 
7860 
7920 
7980 
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GGATCATCAA TTTCTTCACC TAAATTAAAC GCaGTgTnAG GCGCTGTTGG AC CAACTACT 8100 

ACATCATAAT TTTCGAATAC TTTATCAAAG TCATTTTTAA TCAATGTTCT AACTTTTTGA 8160 

GATTTTTTAT AGTAAGCATC ATAGTAACCT GAACTTAATG CAAATGTACC TAAGAAAATA 8220 

CGACGTTTTA CTTCTTTACC GAAACCTTCA GATCTTGACA TTTTATATAA TTCTTCTAAT 8280 

GAATGAGCTT CTTTAGAATG AT AAC CAT AA CGAATTCCGT CAAAACGAGA AAGGTTTGAC 8340 

GAAGCTTCTG ATGATGCAAT CACGTAATAT GATGGAATAC CAAATTTAGT ATTTGGCAAT 84 00 

GATACTTCCT CAACGACAGC ACCTAAAGAT TTTAAAGTTT CTACAGCGTT TTGAACTGCT 84 60 

TCTTTTACGT CATCAGCTAC ACCTTCACCT AAGTATTCTT TAGGTAATGC AACTTTTAAT 8520 

CCTTTAATAT CTTTACCAAT TTCAGATGTA AAGTCTACAT CATCAACTGG TGCACTTGTA 8580 

GAGTCATTAA CATCTGCACC AGAAATAGCT TCTAATACGA TTGCATTATC TTTTACATTT 8640 

20 CGAGTCAATG GACCAATTTG GTCTAATGAA GATGCAAAAG CAACTAATCC AAATCGAGAT 8700 

ACACGACCGT ATGTTGGTTT CATACCGACA ACGCCACAAT ATGCAGCCGG TTGTCTAATT 8760 

GAACCACCTG TGTCTGAACC TAAGCTAAAT GGTACTAAGC CAGCTGCAAc TGCTGCTGCA 8820 

25 GATCCACCTG ATGAACCACC TGGCACTGCT TTATGGTCAA ATGGGTTAAC TGTTTTTTTG 8880 

AAATAAGATG TTTCTGTTGA ACCACCCATT GCAAACTCAT CCATATTTAA TTTACCGATT 8940 

AAAACGGCAT TTTCATTATG TAGTTTTTCC ATTACAGTAG ATTCGTAAAT TGGCACAAAA 9000 

CCTTCTAACA TTTTACTTGC ACATGTTGTT TCTAATC CGT TTGTAATAAT GTTATCTTTT 9060 

ATACCCATTG GAATACCAAA TAATTTGCCA TCCATTTGAT CTTTTGCTTG TAATTCATCC 9120 

AATTCTTGCG CTTTTTTGAT TGCATTTTCT TTATCCAGCG CTAGAAAAGA CTTAATTGTT 9180 

GGATCAGTCT CTTCAATTGC ATCATATATA TCTTTAACAA CATCAGATGG TTTGATTTTT 9240 

TT G T C TTTTA TTAAAGTTAA TAAATTCTCA ACCGATTCGT AGCGAATGCT CATCTTACGC 9300 

GTCCTCCTCA TTCATGATTG TAGGCACTTT AAATTGTCCA TCTTCTGTTT CTTTGGCATT 9360 

TTTCAAAGCT AATTCTTGTG GAATACCTTT AATTGCTTTA TCTTCAOGTA AAACGTTTTG 9420 

TAAATCTAAA ACGTGATATG TAGGTTCAAC GCCTTCTGTA TCAGCGCTAT CATTTTGTTT 94 80 

45 TGCAAAATCT AAAATGCTTT CTAATGTGTT GGCCATTTCT TCCGTTTCTT CAGGAGAAAT 9540 

TTGAAGTCTT GCAAGATTCG CGATATGCTC AACTTCTTCA CGTGTTACTT TTGTCATTAA 9600 

TAAAAGCCTC CTTTAAGTCA TTCATCACTA AATTGTATCA AATTTCCAAT TAAAAATCTA 9660 

50 AGTATTTATG AGGTGCTACT TTAATTTCAT ATAAACTGTA TAAACATTAT CATTCGTTTA 9720 

TCAAATCATT TTTTATGAAA ACAACACTCT TTTAATATTA GACAACCCAA TTCAATATTA 97 80 
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TATATTGGTA TGCAAGTATT TCAAAAAGAA TAAATTTAAT TTTCCTACTT TTCTAAACAT 9 900 
TTATCTTTAT GTATAATGTT TTCAAGTAAC TAAATTATAA ATTAAATAAA GGGAGTGTTT 996 0 

5 ATCATGCTTA CAATGGGGAC AGCATTAAGT CAACAAGTAG ATGCCAATTG GCAAACTTAT 10020 

ATTATGATTG CCGTCTACTT CTTGATACTA ATCGTTATTG GCTTTTACGG TTACAAGCAA 10080 

GCAACTGGTA ACCTAAGCGA GTACATGTTA GGTGGACGTA tATTGGACCG TATATTACTG 1014 0 

W 

CATTATCAGC TGGAGCTTCA GATATGAGTG GATGGATGAT TATGGGGCTA CCTGGTTCTG 10200 

TCTATAGCAC TGGTCTATCA GCTATGTGGA TTACAATCGG TTTAACATTA GGTGCTTATA 10260 

TAAATTACTT TGTTGTTGCT CCTAGACTTC GTGTTTATAC CGAATTAGCT GGAGATGCAA 10320 

75 

TT ACATT AC C AGATTTCTTT AAAAATCGTT TAAACGATAA AAATAATGTG TTAAAGATTA 10380 

TTTCTGGATT GATTATCGTA GTATTCTTTA CATTATATAC ACATTCTGGT TTCGTATCTG 10440 

20 GTGGTAAACT ATTTGAAAGT GCTTTTGGAT TAGATTATCA TTTCGGTTTA ATATTAGTTG 10500 

CTTTCATTGT CATTTTCTAT ACTTTCTTTG GTGGATATTT AG CTGTATCA ATTACAGATT 1056 0 

TCTTCCAAGG TGTCATTATG TTAATTGCGA TGGTTATGGT* CCCTATTGTT GCTATGATGA 10620 

25 ATTTAAACGG CTGGGGAACG TTTCATGATG TAGCAGCTAT GAAACCXACA AATTTAAATT 10680 

TATTTAAAGG GTTATCATTT ATAGGAATTA TCTCTCTATT TTCATGGGGA TTAGGTTATT 10740 

TCGGTCAACC TCATATCATT GTAAGGTTTA TGTCTATTAA ATCACACAAG ATGCTACCTA 10800 

30 AAGCTAGACG TTTAGGTATT AGCTGGATGG CTGTTGGTTT ATTAGGCGCT GTGGCTGTTG 1086 0 

GTTTAACAGG TATTGCATTC GTACCTGCTT AT CATATT AA ACTAGAAGAT CCTGAGACAT 10920 

TATTCATCGT GATGAGTCAA GTACTCTTCC ATCCTCTTGT AGGTGGTTTC TTACTTGCTG 10980 

35 

CGATTCTAGC TGCAATTATG AG CACGATTT CTTCACAATT ACTTGTAACA TCTAGTTCAC 11040 

TAACGGAAGA CTTTTATAAA TTAATTCGTG GTGAAGAAAA AGCTAAAACG CACCAAAAAG 11100 

AATTTGTTAT GATTGGAAGA TTATCTGTAT TAGTTGTAGC AATTGTTGCC ATCGCGATTG 11160 

40 

CATG^^ GGATTTGGTG 11220 

CATCGTTGAG TCCACTTGTG CTATTTGCAC TTTACTGGAA AGGTTTGACA CGTGCCGGTG 11280 

4S CTGTAAGTGG AATGGTTTCA GGTGCCTTAG TCGTTATCGT TTGGATTGCA TGGATTAAAC 11340 

CATTGGCACA TATCAACGAA ATATTCGGCT TATATGAAAT TATTCCTGGA TTTATTGTAA 114 00 

GTGTAATCGT TACATATGTT GTAAGTAAAC TTACTAAAAA ACCTGGTGCA TTTGTTGAAA 114 60 

SO CTGACTTAAA CAAAGTTCGT GACATCGTTA GAGAAAAATA ATTCATAAGT CTTAACAAAT 11520 

TAAAAAGGTA CTAATGTTAA TCAAAATTAT GACTAACATT GGTACCTTTT TATTATCTTT 11580 
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AATTAAAGCA CGTGGTTGGT TACCATCTTT AATACGAATT TCATAGTTAT CGATTTTATC 11700 

GAAATATTTA TTCGCTTGTT CAGTAACGTA CTGTGTAATA CCAATTGTTT CAGCTTGTCC 1176 0 

ATAGTAATCG ATTGGTAAAT CTACTACTAA TCGTTGTGGC TTTTTATCAA CAAATTTAAC 11820 

TTTCCCTACT GCTTGTGTGA AATTAGAAAA ATATGATTGC AAATTATCAT TAAATTGCTT 1188 0 

GAAATTATTA TTTAAATTTT CATCATAATC TGCTGCTGTT GAAGAAGGTA ATAAAGCTGA 11940 

TTTTTCATTG ATATTATGCC ATTCATTAAG CTTTGTTTGA CTCTTTTCTG CAGTCGCTTG 12000 

AGTGATAAAT TCACCTGGTG TGATTGAATC TTCACTTGAT TGCTTATAAA TTGCAAAATG 1206 0 

AATTGGTATA TCTTTTAAAT CATCATTTTC ACGTAACCTT GATAATATCT CACTAGCCAT 12120 

TTGTTTACCT TGCTTTTTAA CTcGCTATCA TCTAGTTTTT TACTAAAAGT CGATCCATCT 12180 

TTTTCTTTTT TATAGTAATA AACACTATTC ATAGCTAAAC CAATCGTCAT ACCTTTAATA 12240 

TTCTTACCTT TTGTATCTCC ACCACCATAA AAATCTTGCT CTAAAATGTT AGATAAATAG 123 00 

GCTGGTGATT TTTCTGCAAT CTTTTCAGGA TCTGTTTCAC CTtCGTGTGA TGGATTAAGT 123 60 

CCTAAATTTT CATTCGCTTT CTTGTCTTTT TTATCTTTTT CAGACATTTT ATCGATTTCA 12420 

25 CGTTTTGTAT ACTTAGGATT TAAATAGGCA TTAATTGTTT TCTTGTCCAA AAATTGACCA 124 8 0 

TCTTGATACA AATATTTATC TGTTGGAAAT ACTTCTTTAC TTAAGTTCAA TAAACCATCT 12540 

TCAAAGTCGC CGCCATTATA ACTATTTGCC ATGTTATCTT GTAAAAGTCC TCTTGCCTGG 126 00 

30 CTTTCTTTAA ATGGTAACAA TGTACGATAG TTATCACCTT GTACATTTTT ATCCGTTGCA 126 6 0 

ATTTCTTTTA CTTGATTTGA ACTATTGTTA TGTTTTTGAT TATCTTTTCC AGCCTGGTCA 12720 

TCCTTATGGT TACCACAAGC AGCGAGTATA AAGATAGCTG TAATCAATAA TACTAATGTA 127 8 0 

CGCTTCATCG ACATACCCCT CTAACTATTT AATTCATTTT GCTTATCTAC AAATTGTTGC 12840 

TCTGTCCAAA TTTCAATACC TAAACTTTGT GCTTTTGTTA ATTTTGAACC TGCATCTTCA 12900 

CCAGCAATAA CGACATCTGT ATTTTTAGTA ACGCTACTTG TAACTTTAGC ACCTTGTGAT * 12960 

GCAAGCCATT TAGATGCTTC ATTGCGTGTC ATTTGATGTA GCTTACCAGT CAGTACTATC 13020 

GTTTTACCAC TAAATTCAGG ATGTCCTTCA ATATCTGATG TTTTGATACC TTTATAAATC 13080 

ATATTAACAT GTTTATCTTT TAATTTTTGA ATTAAAGCAC GAATATCTTC ATTTTCTAAA 1314 0 

TAAGTAACTA CAGATTGTGC TACTTTATCA CCTATATCAT GAATTTCTAC TAATTCCGCT 13200 

TCAGTTACCG TTAGTAATCG ATCTATCGTT TCATATTTTT CTGCTAACAC TTGGCTCGCT 132 60 

SO TTAACACCTA AATGCCTAAT ACCTAGACCA AATAATAAAT TTTCTAAAGA GTTGTCCTTA 13 3 20 

GCTTGTTGAA TGGCAGCTAA TAAATTATCA ACTTTTTTCT GCCCC A TTCT GTCTAAAGGT 13 3 80 
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TAAAGCTGTT GAATAATTTT AGTGCCTAAA CCATCAATAT TcATGGCTTG TCTTGaTACA 
AAGTGnATCa ATCCtTcAAC AAGTTGTGCT TGGTCATTTT GG 
(2) INFORMATION FOR SEQ ID NO: 155: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1893 base pairs 

(B) TYPE: nucleic acid 
<C) STRAND EDNESS : double 
(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 155: 
CAGTAAACAC CTCTGATTAC GAATATTTAT ACATTTATTT TAACACATGC ACTGATTTAC 
GACTACTAAA CACCTTTACG TAAAAAGGGT AAACATGGTT TATCTATCTT GGTTATCTAT 
TTATAAATAT TTnTCATATT ACGCATAACA ATTGCTTAAA ATATGTATAA AAATGAATAT 
ATGTGTAATA AACTTGCTAA TTATTAGATT TAATAAGCGT CAATTGTTTG AACATATTtA 
ATTAAAATCA CATTGATATC ACAGATACGA ATATTGTCGT ATAGAAATTG AAAATTCTAT 
TTTTTAAATG AAAGTCTTCA ACATAATTTT AAGTTTCAAC ATGAGAAAAA TCGATTAACA 
AACAACGTCA GTTGAATATG CCTTTTGAGA CATTTCAAAC TTTACAATTG TTGCTAATCG 
ATATATTTGC TTTTAGTGAT CCCTGCTATA AAATAAATCA ACGATTTCTA ATAAGTGTTT 
TGTATTGAAT TGTTCATCAA TTTGCGTTAG TTCATCCACT GCTGCGTCTC TATGATAAGT 
CAATTTATCT TCTGCGCCAT CTTTCCCTAA TAAACTCACG TACGTACTTT TATTATTTTC 
AAGATCGCTG CCCACTTTTT TACCTAACTT TGCTTCATCA CCATAGCAGT CTAATAAATC 
AT CTTTAATC TGGAACATCA TACCTAAATG ATAACTATAA CTTTCTAAAT GTTCTTTAGT 
TGT$TCATCG ACATTAGCGA TATCTGCTGC ACTCATAACC GCAAAAGTTA ATAATGCTCC 
TGTTTTTGTT TTGTGTATCA TTTCCAAAGT TTCAAGATCA ATTGGTTGGC CTTCGCTTTG 



CATAT CTAAC ATTTGACCGC CGACCATTCC AACATGACCA CTTGCTATTG ACAGCCGTTG 
TAGAACTTTT ATTTTTACTT CATCAGTTAA TCTATCATCA CTTGAAATAA GTTCAAATGC 
TTTAGTTAAT AAAG CATCAC CTGCTAATAT CGCAGTCCAC TCACCATATA CTTTATGATT 
TGTTAATTTT CCTCGTCGAT AATCATCATT ATCCATCGCT GGTAGGTCAT CATGAATAAG 
TGAATATGTA TGAATCATTT CTAGTGCAAT TGCGCTCTTC ATACCTAACT CATACTCGGT 
ATTTAGTGAA TCTAAAGTGA GTAATAACAG AACTGGTCGG ATGCGTTTAC CTCCAGCATT 
TAATGAATAC AACATACTTT CTTCTAGCTG AGTATCCATT ACTGATTTAT TTATCGCAAC 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
"900 
960 
1020 
1080 
1140 
1200 
1260 
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CATCCTCAGC TTCTTCTTTT ATTAAGTCAT TCACCTTTTT TTCGGCATTT TTTAAAGTTG 1380 

TGTCACAAGC TGCTGATAGT TTCATACCAC GTTGATATAA ATCTAATGAT TCCTCTAAAG 144 0 

ATACTGTTTC ATTATCTAAT TTTTGAACAA TTTGCTCTAA TTCTTGCATC ATTTCTTCAA 1500 

AACTTTGCGT TTCTTTAGTC ATTATTACAC CTTACTTTCG TAACTTTTGC ATCTACTAAG 156 0 

CCATCTTTCA TTGTTAACGT CAATTGATCA TTTTCTGTTA AATCTTTAGT ACT CGTAATG 1620 

ACTTCGTCTT TTTTATTAAC AATTGCATAT CCACGCAACA TTGTATTAGT TGGACTTAAA 16 8 0 

TTGTTTAAGT TTTCTACTTT ATTTTTCAAA TCATTTTTAT AACTTAATAT CTTAGAATTC 174 0 

AATAATTTAA CAAGTTGGTT TGTCAATTGA AGATTATnTT GTTGTTCTTG ATTAACACTA 1800 

CTTAGTAATG CTTTTAAATn ATAACGTTGG TGCAACAGCA TTAAATCGAG GCCCCGGTGG 1860 

TCCAAAGTTG CCCGAATTnG TGGTTTCAGG CCC 1893 
(2) INFORMATION FOR SEQ ID NO: 156: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 821 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
25 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 156: 

AAAATATATT CCTTCACTTA ATATTCAATT AGAGAAAAAC ATGGTGATTG TAATATGTTG 6 0 

TGCAATATTT CTGGGTGTTT TAATACTTTT TTTATTTCTG AATCGTAAGC TAAGGTTGGA 12 0 

AATTTATAAT AATAACTCTA GTAAAGGGAA AATAATTTTA TTTCCTTCAT TAAAAAACTT 180 

TTGTTTCACA ATATTTTATT ATTTTTTATT TGGCGGTCTT TCAATAATGG CTCTAAGTAT 24 0 

GTTATTAACT TTAAATCCTC AAAATATAAT AGGCTTTATT GGTTGGTTGG TAATGACTGC 300 

AGGTTTCTTT CTGTTAAACA TGTCATCGAT TATTGACAAA AAAATTTATG TATTATCTAA 360 

AACTAACACG GTGGAAAAAT GATGGTTTAG CTGG ATTTAC TGCAGGTTCT ATTTCGGCAA 420 

TACTTGTATA TTGGACCAAT CAAAAAAATG AATTTGGAAT AAAAGATAAA AACGATTGGA 480 

45 TAGGACATAA ACTAGACGTT GGTATAGATG CTGTAGAAAA ATCTGCAGAA AAAACAGTAG 54 0 

ATGGTGTTGA AAATGTCATG GTGAAGCTTC AAAAAGTATT TCTAATCATA TAAGCCCTAA 600 

GAAATGGAGC TGGTAAATGT TGCTATGCGA ATCTAAAATC ATCAATAAAA ACCCAAAATA 660 

SO TAGAATTATT AAATATAATG ATGAATACTT AATGGTCGAT ATAATAAGCA CTTGGATTAG 720 

TTTATTTTTT CCTTTTATTA ATTGGTTCAT CCCaAAAGaA TACGTCAAAA TTAGTAGAGA 780 
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(2) INFORMATION FOR SEQ ID NO: 157: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 2343 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 157: 





AGTAAGATAA 


TTTTCAATTA 


GAAAATATCT 


TACTGCTGTT 


CTCTATTTAT 


ACAATACTTC 


60 


15 


GTATTGAATG 


GcTTCGCTTT 


CCTAGGGTGC 


CGTCTCAGCC 


TTGGTCTTCG 


ACTGGCACTG 


120 




CTCCCTCAGG 


AGTCTCGCCA 


TTAATACTAC 


GTATTAACAT 


GTAATTTTAC 


TTTGAAATAC 


180 




TTTTAAAAAA 


TAAGACACTT 


TGCCCAACTT 


GCACATAAAT 


GTAAAATTCA 


ATAAAATGAA 


240 


20 


TTTTCTGTGT 


TGGGTCCCTT 


CTTATAATTT 


AATAAATACC 


ACTAAACTAA 


ATTAACGAGG 


300 




TGCCTTATGT 


ATAAAAATTA 


TAACATGCCC 


CAACTACACT 


AC CAATAGAA 


ACTTCTGTTA 


360 




GAATCCCTCA 


AAATGATATT 


T CAULr A 1 A 1 vj 






ATACCTGATA 


420 


25 


GCGAATTCGA 


TGAATTCAGA 


CATCATCGTG 


GCGCAACATC 


CTATCATCCA 


AAAATGATGT 


480 




TAAAAATCAT 


CTTATATGCA 


TATACTCAAT 


CTGTTTAATT 


ATGTTCAAAG 


CATTAAGGTA 


540 




ACAAGACAAT 


ATCTAAGATA 


TCAAAGATAG 


aaaitttttg 


ACGTTGTTGC 


TGATTGTAAA 


600 


30 


CATAACCATC 


AATTTCATAA 


TT AAT AG CAT 


CAATACGATA 


AATGGTTAAG 


CGTACTGAAT 


660 




CTACAAAGCC 


ATTATTATAA 


AATTTAACTT 


CTACAGGTTG 


GGCATATTGT 


AGCGCCTCGT 


720 


35 


GTAGCCGAAT 


GTTTAGCTCA 


GCCAATTGAT 


CATCTGATAA 


TACAGGACGT 


GTAATTTTGT 


780 


TTTGGTCGAT 


AATGTATTGT 


TGAATCGTTT 


CGAATTGTTC 


GGGTAATGTT 


GCAAAAGGAG 


840 




CCOSTTTAAT CATGCCTCTT 


CCCATAGGTA 


TATTGTTATC 


TAGTAATTCT 


CTTGGAACGT 


900 


40 


T ACGATAAT C 


AGTTTCTTCT 


TCATAACTTG 


TCATCCTTAA 


TTCACCCCAA 


TCTGATAATT 


960 




ACATTATACG 


AACATGTGTT 


CTATTTTGCA 


^CAW^TTT 


TGTGGaAGCA TAAACGCGTT 


1020" 




AATAATTAAT 


GCTCGTGtAA 


GTAAAAAAGA 


GGGATTAATT 


AAAATCGAAT 


AATGaCATAT 


1080 


45 


CACaGCAAAT 


AGTTCTTTTA 


AAGTAGTTAA 


ATAGTTTTAG 


CTTTAAGGAA 


aTGATAAaTG 


1140 




ATTGTwAATT 


CTAGCTAAAA 


TTTAATAAAA 


TGAAAATAAG 


ACTAACATGG 


AGGGGTAAAA 


1200 




GTAATGACAA 


ATGGATATAT 


TGGTTCTTAC 


ACTAAAAAGA ATGGTAAAGG 


GATTTATCGT 


1260 


SO 


TTTGAATTAA 


ACGAAAATCA 


GTCACGTATT 


GATTTATTAG 


AAACAGGATT 


TGAATTAGAA 


1320 




GCGTCTACAT 


ATTTGGTGCG 


TAATAATGAA 


GTTTTATATG 


GAATCAACAA 


AGAAGGAGAA 


1380 
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TGTTTGTCTT CAAAAGCTGG TACAGGTTGT TATGTATCGA TTTCAGAAGA TAAACGATAT 1500 

TTATTTGAAG CGGTATATGG TGCTGGCATC ATACGTATGT ATGAATTAAA TACGCACACA 1550 

GGTGAAATTA TACGTCTAAT TCAAGAACTT GCACATGATT TTCCAACAGG TACACATGAA 162 0 

AGACAAGATC ATCCACACGC ACATTATATT AATCAAACTC CAGATGGTAA GTACGTTGCA 1SQQ 

GTAACAGATT TAGGTGCTGA TCGTATCGTT ACTTATAAAT TTGATGACAA CGGGTTTGAA 174 0 

TTTTATAAAG AATCTTTATT TAAAGATAGT GATGGGACAA GACATATTGA ATTTCATGAT 180 0 

AATGGAAAAT TTGCTTATGT CGTACACGAA TTATCAAATA CTGTGAGTGT TGCAGAATAT i86 0 

AATGACGGTA AATTTGAAGA GCTCGAGCGT CATTTAACAA TTCCTGAAAA CTTTGATGGA 192 0 

GATACTAAAC TTGcAGCAGT GCGTTTATCT CATGaTCAAC AATTCTTATA TGTATCTAAT 1980 

AGAGGGCATG ATAGCATTGC AATTTTTAAA GTTCTTGATA ATGGTCAACA CTTAGAACTA 204 0 

GTAACAaTTA CTGAAa GTGG TGGTCAATTC CCAAGAGATT TTAATATTGC CTCATCAGAT 210 0 

GACCyTTTAG TTTgTGCTCA kGaGCaAGGA GATTCAGTTG TAACTGTTTT CGAAAGAAAT 216 0 

AAAGAAACAG GTAAAATTAC GCTATGTGAT AACACTCGTG TAG CATCTGA AGGTGTATGT 222 0 

25 GTCATATTTT AATCTTTAAT TAATCATGAT AAAAAGAAAA CCATGTTTCC AAAAAATTTG 22 8 0 

TGTATACCTT GAAATTTATT GnTTTCCAGn ACATCAATTA TGGGAAGCAT GGnTTATTTT 234 0 

TGT 2343 
(2) INFORMATION FOR SEQ ID NO: 158: 



IS 



20 



30 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 4 837 base pairs 

(B) TYPE: nucleic acid 
35 <C> STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 158: 

AAATTGCCAG TTGGTATCGC TTCTGGTGCA GTAGTCGAAG GTTTCTTCCA AGGTATCATT 60 

CCGATTGGCT ATATCGTTAT GATGGCAGTA TTGTTATACA AAATTACTGT TGAATCTGGA 120 

CAATTTTTAA CAATTCAAGA TAGTATTACA AATATTTCAC AAGACCAACG TATTCAAGTT 180 

TTACTTATTG GATTTGCATT CAACGCATTT TTAGAAGGTG CAGCAGGATT TGGTGTACCA 240 

ATTGCAATTT GTGCACTTTT ATTAACACAA TTAGGATTTA ATCCATTAAA AGCTGCGATG 300 

SO TTATGTTTAG TCGCAAATGC AGCGTCTGGT GCTTTTGGTG CGATTGGTAT CCCTGTAGGT 360 

GTTGTAGAAA CGTTGAAATT ACCTGGAGAT GTTTCAGTAT TAGGTGTTTC TCAATCAGCA 420 



55 



NSDOCID- <EP 07865 19A2. 1 > 



787 



EP0 786 519 A2 



GGTTTTAGAG GTGTTAAAGA AACATTACCA GCAATTTTAG TAGTTT CAAT CACTTATACA 540 

CTTACTCAAG GATTATTAAC TGTATTCAGT GGACCTGAAT TAGCAGATAT TATTCCACCG 600 

5 TTATTAACAA TGTTAGCATT AG GAGTATTT TCTAAAAAAT TCCAACCAAA ACACATTTAT 660 

CGTGTTAATA AAGATGAAGA AATTGAACCT GCAAAAGCAC ATTCTGCAAA AGCAGTATTA 720 

CATGCATGGA GCCCATTCAT TGTATTAACA GTCATTGTAA TGATTTGGAG TGCGCCATTC 780 

10 

TTTAAAAACT TATTCTTACC AAATGGTGCT TTATCATCAT TAGTATTTAA ATTCAACTTA 84 0 

CCTGGaACAA TCAGCGAAGT TACG CATAAA CCATTAGTAT TGACTTTAAA TATTATTGGA 900 

CAAACAGGTA CAGCTATTTT ATTAACTATT ATTATTACAA TTTTAATGTC TAAAAAGGTT 960 

75 

AACTTTAAAG ATGCAGGTAG ATTATTCGGC GTTACATTTA AAGAGTTGTG GTTACCAGTT 1020 

CTTACAATTT GTTTCATCTT AGCAATTTCT AAAATCACAA CTTATGGTGG TTTAAGTGCA 1080 

2Q GCAATGGGTC AAGGTATTGC TAAAGCAGGT AATGTCTTCC CAGTTCTATC ACCAATTTTA 1140 

GGTTGGATAG GTGTGTTTAT GACAGGATCA GTTGTAAATA ACAACTCATT ATTTGCACCA .1200 

ATTCAAGCTT CTGTTGCACA ACAAATTGGA ACAAGTGGTT CACTTCTTGT ATCTGCTAAT 126 0 

25 ACAGTTGGTG GTGTAGCGGC AAAATTGATT TCACCACAAT CAATTGCAAT TGCAACTGCA 1320 

GCAGTAAAAC AAGTTGGTAA GGAATCAGAA TTATTAAAAA TGACATTGAA ATACAGTGTA 13 80 

TGTTTACTAA TATT CATCTG TATTTGGACT TTCATCTTGT CATTATTATA AAAAAACGTA 14 40 

30 TTTCAAAATA TAAATATACA GAAGGTGAGA TGTTTTCTAA CATCTCATCT TTTTTTTATG 1500 

GATCATTAAT GAAAGAAGTT TGACATTATA ATAATGGTAG CX5CTTTATGT TAAAATGAAT 1560 

AGTGAGTAAT CAGCAATCAA ATTAAATTGG TTGATAGCTG TTAAGGTTTG TGGTTTTGTC 1620 

35 

TTTGTGCTAT CGCnCATAAA GTATATAATT AAAGTAGTTT CGTTATTATA AAATATTAAT 1680 

ATACATAGTA GATAGTAATA GAG CATCAC C ATGGGAACCT ATTGAGACAC TTATTGATTT 1740 

AAAGTGGTAT TAATATGTCG TATTTCTCGA ACGTTCCATT ATTCATTTTA AAAAGGGGGA 1600 

40 

CTCTATTlfel^TATG^ CAAOftT^ CATCTTAAra GGTGGCGGTA I860 

TTATGAGTGC aCATTAGGAA CATTACTTAA AGAATTATCA CCTGAGAAAA ATATTAAAGT 1920 

GTTTGAAAAA TTAGCACAAC CTGGCGAAGA GAGTTCAAAT GT ATGGAAT A ATGCCGGTAC 1980 

45 

AGGGCATTCA GCACTTTGCG AGTTGAACTA TACAAAAGAA GGTAAGGATG GCACAGTTGA 2040 

TTGTAGTAAA GCAATTAAGA T AAATG AG CA GTACCAAATT TCAAAACAGT TTTGGGCATA 2100 

SO TTTAGTTAAA ACAGGACAAT TAGATAACCC AGATCGCTTT ATTCAAGCGG TGCCACACAT 2160 

GAGTTTTGTC ATTGGCGAAG ATAATGTAGC TTTTATAAAA AGTCGTGTTG CAACGTTAAA 2220 

55 
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GGTACCGTTA 


ATGATTGAAG 


GTCGTAAGTC 


TGATGAACCA 


ATTGCTTTAA 


CTTATGATGA 


2340 




AACTGGTACa 


gATGTTAACT 


TTGGTGCGTT 


AACTGCAAAG 


TTATTTGATA 


ATTTAGAGCA 


2400 


5 


ACGTGGTGTG 


GGAATTCAAT 


ATAAGCAGAA 


TGTATTAGAC 


ATCAAGAAAC 


AGAAATCTGG 


2460 




GGTATGGCTA 


GTTAAAGTTA 


AAGATTTAGA 


AACTAATGAA 


ACGACAACAT 


ATGAATCTGA 


2520 


10 


TTTTGTATTT 


ATTGGTGCTG 


GCGGTGCGAG 


TTTACCATTA 


CTCCAAAAGA 


CTGGGATTAA 


2580 


ACAATCAAAA 


CATATTGGTG 


GTTTCCCGGT 


AAGTGGATTA 


TTCCTGCGCT 


GTACAAATCA 


2640 




AGAAGTGATT 


GATCGTCATC 


ATGCTAAAGT 


GTACGGAAAA 


GCAG CAGTGG 


GTGCGCCACC 


2700 


1£ 


AATGTCAGTG 


CCGCACTTAG 


ATACACGTTT 


TGTAGACGGC 


AAGCGTTCAT 


TGTTATTTGG 


2760 


TCCATTTGCA 


GGTTTCTCAC 


CTAAATTTTT 


AAAAACAGGT 


TCACATATGG 


ATTTAATTAA 


2820 




ATCGGTTAAA 


CCAAATAATA 


TCGTGACGAT 


GTTATCTGCA 


GGTATCAAAG 


AAATGAGTCT 


2880 


20 


TACGAAGTAT 


TTAGTGTCAC 


AATTGATGTT 


ATCTAATGAT 


GAGCGTATGG 


ATGATTTAAG 


2940 




AGTCTTTTTC 


CCAAATGCTA 


AAAATGAAGA 


TTGGGAAGTG 


ATTACAGCAG 


GGCAACGTGT 


3000 




CCAAGTAATC 


AAGGATACTG 


AGGATTCTAA 


AGGTAACTTA 


CAATTTGGTA 


CTGAAGTTAT 


3060 


25 


TACGTCAGAT 


GATGGCACAT 


TAGCTGCATT 


ACTTGGTGCA 


TCACCTGGTC 


CGTCAACAGC 


3120 




TGTAGATATT 


ATGTTTGATG 


TTTTACAGAG 


ATGCTATCGT 


GATGAATTCA 


AAGGATGGGA 


3180 




ACCAAAGATT 


AAAGAAATGG 


TGCCGTCATT 


TGGTTATCGC 


tTAACAGATC 


ATGAGGATTT 


3240 


30 


ATATCATAAA 


ATTAATGAAG 


AAGTAACTAA 


GTATTTACAA 


GTTAAATAAT 


AAACGAAACG 


3300 




GTAATGTCTT 


TTTTAATGTG 


ATAGACATTA 


CCGTTTTTTA 


GTGGTTAATA 


AAAATCATTT 


3360 




TAATTGTTTC 


AGTTGCTTGT 


TAATAGTGTC 


TACGTAGTTC 


TTGTTTTTAA 


AGAATTGAAT 


3420 




TATCCAAATT 


AATACATAAA 


CCACAATGAA 


GATAATTGTG 


AATATGATTA 


GATAATGCAC 


3480 




TGTTAGTGGA 


AACCAACCGG 


CAAGCATTGC 


TAAAGGCAAG 


AATCCGACAT 


ACGTTGTTAT 


3540 


40 


GAAATGCATT 


ATAGTTG CTT 


TAGTAATGCT 


CCAATCTGTG 


TATTTAAAGA 


TAAAATCTCC 


3600 


AAGGAAAAAG 


ACGACGCCTA TGAGTAACCA 


TAAAATGATA 


GAAATCAACA 


TTACGGTAGT 


3660 




TTCTGTGAAA 


TGCGTATAAT 


ACAAT ATGC C 


AATAGTTGAT 


TGTGGGTTCA 


GTGGATAATA 


3720 


45 


TTTGCCGTCT 


GGAAATAACA 


TACTAAAGAA 


CAGTGAAAGG 


GACAAACCAA 


TGATTAAGCT 


3780 




AATAAATAAT 


GAGTTTTTCA 


AATTTTTCAT 


ATTGATAAGC 


GCTCCTTTAT 


AGATTTTAAA 


3840 




TAACGTCTAG 


AAGAATAGGT 


GTAGTGTGCA 


TCTTTAAGAT 


ACATACGTAT 


AAGTCCATTT 


3900 


SO 


GGCTCTAATA 


ATAATTTTTC 


AATGTAATAC 


TTGTTGACGA 


TTTCTGATTT 


GGAAATGCGA 


3960 




ATGAAATGTT 


GTGGTAACTG 


TTTTTCTAGT 


TCATAAAGTC 


GTAATTTTAG 


TTTGAATTTT 


4020 



ss 
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ACATTAATGA TATGGATTTC TTTGTCTATG TATCCGACTA ATGTATGTGA TTTGTCTAAA 414 0 

TCATTGACTG CATTAATAAT ACTTTGAACG TTATCATTCA TTTTAGGTGC ATGTATATCA 4200 

5 ATATAAGATT CCGTCTCATT TGCATTGATA AATAAATTGA GTTT CATCAT AGGTTAATGC 4260 

CTCCTTCAAA ATTATTAAAC CATAAATGAC CATCGATATA TTTAAATTTT GTTGAATGGT 43 2 0 

AGAAATTAAA TGTTAAGTGG CTAGAAAGCG CTAATCAATA TAAAAGATAC CTCCTGAAAT 43 8 0 

AAAAACAGAA ATGTTTTTTC AGGAGGTAGA GATTAAAGTG AATTATTTGG CAGTGTAATA 444 0 

GTAAAGGTGG TTACATACTC GTTACTTTGT GTGAATTGGA TTGTACCATG ATGCAATTCA 4500 

ATGATGGATT TTGTAATTGC AAGACCTAAA C CATTG CT AT TATCATGTTT GCTCACTTTA 4560 

15 

TAAAAACGTT CAAATAAACG TGCTTCAGCT TGTGGACTAA TTGGTGAACC ATCATTACTT 4620 

ATTGTGAAAA TGATATTGTT GTGACTATGT TGCAAAGCGA TGTCAATGGC ACCACCAACA 46 80 

20 TCTGTATACT TAATAGCATT TATTAATAAA TTACTCAATG CTTGATGTAA CAAACGTTGA 474 0 

TTTCCTAGGA AATTGATGAT TCTAGGTCAG CTAAnATGAT TAACGACTTT TCATCAGCAG 4800 

CAnATTGTTC ATGTCGAATG ATATCnTTAA TGAGCTG 4 837 

25 {2 5 INFORMATION FOR SEQ ID NO: 159: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1600 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 159: 

TTCCACTTAC AACAGAAATG 60 

AGTCTTTTCC ATCATTGACA 120 

CATAACCACT TTTTGCCAAA 180 

TAAGCMCTT^TCCACTCC ~ ~ 24 0 

CAAAATACTG TAACTACTTT 300 

GGACTCATTT TAAATATACG 3 60 

GATAATGTTT CAATTACGAA 420 

ATGATTGAAA TGGTAGCAAA 4 B0 

ACTTTAGCAG GGTTAATGTT 54 0 

CAGAAAATAC CAATTGCCGT 600 



35 

ACAATTATTG GATTATTATC AAGCAACGTT AATGGATGAC 
CCCATAGATT CTAAATCTtT TGCATGAGCA TCTTGTGATA 
GTTACATTCG CACCTAATTT ACTTAATAAT TTAGCTGCTT 

40 

CO^C^C^~ATAG ^ TrrTT A ' nTI CTAAcT "CCTGTAT^T^ 
AATCCATAAA CCGATTAAAC CTGAAATCAG ACCAACAGCC 

4S CCATTCGCTC CATCCTATCA ATTCAAAATG ATGATGAATC 

CTTTCCAGTC AATTTAAAGC TAGCGACTTG TAACATAACA 
TACTAAACCT ATAAAAATTA ATGATAATTC CTGATTAAGC 

50 TATACCACCT AAAGCTAAGC TACCTGTATC TCCCATAAAC 

ATATGGTAAA AATCCTAAAA GTGCAAACAA CATAATGATA 

55 
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TGCTAATCCA TCTAAACCAT CTGTTAAATT TACTGCATTA GAAAAACCTA CTTGCCAAAA 720 

AACAATGAAA ATAACATATG CAAATGATAG TGGGATTGCT ACATT CGTAA ATGGAATATG 780 

5 TATGCTCGTA GAAAAATTCA CCAAATGAAA CACATTACTT AAAACAAAGA ATATAATCGC 84 0 

AATACCAATT TGCGCCAAAA ACTTCTGTTT ACTTGTTAAA CCTTGGTTAT TCTTTTTAAC 900 

AACAATAATA TAATCATCTA TAAAACCAAT TAACCCAAAA CCAATCGTCA CAAATAATAA 960 

10 

CAGTATGATT GGATTAGCTT GATCTACAAA TATAATAGCC ACCAAAGACG TTATCACAAT 102 0 

ACTTAATAGA AATGTTAGTC CACCCATCGT TGGTGTACCA GTCTTCTTCA TATGGCTTTG 1080 

TGGACCTTCT TCTCGAATAC TTTGACCAAA TTTCATCCTT TTTAATGTAG GTATTAAAAC 114 0 

15 

AGGTACCAAA ACAAATGTAA TCACTAGCGC TAATAACGCA TATACAAAAA TCATAACTAT 1200 

CTCCTCTTCT TAATCCAGAC TTTTTTAACC ACTAATATAT TATCAATTTT TCAATTAAAT 1260 

20 AAACAAAGTT GTAATCAAAA TTTATAATTT TTCTTTTTTA CGG CAT AAG A GGCCAGTATA 1320 

AAAAGTTTGC CTATAACAAA CAAGTTAATC TGACCTCGTC TACCTTAAAA TTCTCTATCA 138 0 

ACACTTATTT ATAAAGATTA AATGAAGATG TTGTTTTCTA TCACAGCATT ACTTTAGTAA 144 0 

25 AAACAAATAG TGACAATACA TCCTAATTTA ATGT AGC CAT TCTTGTTAGT CCGACTTATC 1500 

CTTGTCAGTT TTACTGTCAG ATTTCnTCTT ATCATCTGAA TTTGAATCAG AATTATTCGT 156 0 

CGAATTGCTG TCTACATTCT CTGGATGGAA AATTCTACGT 16 0 0 

30 (2) INFORMATION FOR SEQ ID NO; 160: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1186 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 160: 

40 

ATTGCCTTTG TTTTAATTTT AAATCAAAAT mGCCTATGAA AGATTTAAAT CAATTAATTT 60 

CTATAATATT ATCATTTTTA AAG CAT ATCA TTGTTTAGTT TTTTTATAAT TGGATAAATA 120 

45 CTAATAGTTA CTTTATAAAA CATTACATAG AGAAAGGTTA AGGAGTGCAC ATGTCGAAAA 180 

AGGATCACTC TTCTTCAAAA TACCTTAATT CTGTTAAGGA AGCGCAAGAG GAGTCAAAAA 24 0 

AGAAAAATAA AAGTAATCCC AAAATTGATG TTGATCGTAC ATATATTGAA CCTCAACAAT 3 00 

50 TCCAATCTAA GAAACCTAAA AAAGATGATC AGGTTTTCTT CTTATCAAGA TTAAATAAAC 360 

CTGCAAAATA TAAGAAAGAC TCTAATTTCT TATCATATCT CATCTATCGC ATAGGAAAAG 420 

55 
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10 



15 



TGTTGCTTTT CCTATTAACA TTATTAC CAT TTTTCAATAT TAAGCAGAGT CAAATTACTA 540 

ATATGTTAAG CAATGCACCC GCTGAAACAT CTACTCTAAT TAAGAGTGTA ATTGGTGATA 600 

TAACTCAAAA CTCCAGTGGT GGCTTATTAT CTATCGGTTT GATTTTAGCA ATTTGGTCAG 660 

CTTCAAATGG AATGACTGCA ATTATGAATT CTTTCAATGT TGCTTACGAT GTAGAAGATA 720 

GCCGTAATGG AATCGTATTA AAACTACTAA GTGTTGTCTT CACTGTAGTT ATGGGCGTTG 780 

TGTTTGTAGT TGCTCTAGCA TTACCAACGC TTGGTTCTGT AATTAGTCAT TTCCTATTCG 84 0 

GTC CACTTGG aTTTGACGAA CAAGTGAAAT GGATTTTTAA CCTTATTAGA ATTGTGTTAC 900 

CAATCATTAT TATATTTATC ATATTTATCG TGTTATATTC GGTTGCACCT AACGTTAAAA 960 

CGAAGCTTAA GTCAGTATTA CCAGGTGCAG TATTTACTTC AATTATTTGG TTAGCTGGTT 1020 

CATTTGGTTT TGGTTGGTAT ATTTCAAATT TTGGTAACTA TTCTAAAACA TATGGCAGTA 1080 

20 TCGCGGGTAT CATCATTTTG TTACTATGGT TATATATCAC AAGTTTTATT ATAATTGTCG 114 0 

GnGCTGAAAT CAATG CAATC ATTCATCAGC GTAGTGTAAT TAAAGG 1186 
(2) INFORMATION FOR SEQ ID NO: 161: 

25 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7872 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 161: 
TCTTGAGCCA TCTTTTGAGC TAACTGACTA GATTGATACC CAAAAATCAT AGTTACCAAC 6 0 

35 

ATAAACTTTA ATTTTACCGA AGTCTAAATC AGCGATATGA GTACATACAT TATTTAAGAA 120 
ATGACGGTCA TG CGAT ACT A CGATAACAGT ATTATCAAAG TTAATTAAGA AATCTTCTAA 1B0 
CCAACTGATT GCTGGAATAT CGAGACCGTT AGTAGGCTCA TCCAGTAATA GTACGTCTGG 24 0 

40 



TTCACCGAAT AAACTTTGCG CTAATAATAC TTTAATTTTT TGGTTGTTTT CTAATTCAGC 300 

CATTTTTTTA TCGTGTAAAG TTGGATCGAT ACCTAAACCA GATAAAAGGT TAGCAGCATC 360 

45 AGCTTCAGCA TTCCAACCAT TCATTTCTGC AAATTCACCT TCAAGTTCAG CAGCACGGAT 420 

ACCATCTTCA TCACTGAAAT CTGGCTTCAT ATAGATTTCA TCTTTTTCTT TCATAACCTC 4 80 

ATAAAGACGT TCGTGACCTT TAATTACAAC ATCAAGCACG CGTTCATCTT CATAAGCATA 540 

SO GTGGTCCTGT TTTAAAACAG CTAGACGTTC ATTTTTCCCT AATGAAACAT GTCCTGTTTG 600 

AGAATCTAAT TCACCAGATA ATATTTTTAA GAATGTTGAT TTACCTGCAC CATTCGCACC 660 



SS 
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ATCTCCAAAA CGTAAACTCA CATCAGTTAC TTGTAACATG CATTTTCTCC TTTTTTTCAT 780 

TCGATATTCT AACGGAAGAA TTATATCATA TTATCGTCAC AGTTTCGACC TCATATAAGT 84 0 

5 TGTAATGATA GAATGACTCA CACATGTTAT AATAATAAAG AATACAAGAA TCGAAGGAGA 900 

AT AACATGG C ATTAGACAAA GATATAGTAG GTTCTATAGA ATTCCTTGAA GTAGTAGGGT 96 0 

TACAAGGTTC AACTTACCTT TTAAAAGGAC CAAACGGTGA AAACGTAAAG TTAAACCAAT 102 0 

10 

CAGAAATGAA CGATGATGAT GAATTAGAAG TAGGTGAAGA ATATAGTTTC TTCATTTATC 108 0 

CAAACCGTTC AGGTGAATTA TTTGCAACTC AAAATATGCC TGATATTACG AAAGATAAAT 114 0 

ATGACTTTGC TAAAGTACTT AAAACGGATC GCGATGGGGC ACGTATAGAT GTTGGATTAC 1200 

CCCGTGAAGT GTTAGT AC CA TGGGAAGATT T AC CAAAAGT GAAATCACTA TGGCCACAAC 1260 

CTGGTGATTA TTTGCTAGTT ACATTACGAA TTGACCGTGA GAATCATATG TATGGACGTT 1320 

2Q TAGCGAGTGA ATCTGTTGTA GAAAATATGT TTACACCTGT ACACGACGAT AATTTAAAAA 13 80 

ACGAaGTCAT TGAAGCCAAA CCTTACCGCG TATTACGAAT TGGTAGCTTT TTATTAAGCG 144 0 

AATCAGGTTA CAAAATTTTC GTACATGAAT CAGAACGTAA AG CTGAAC CA AGATTAGGTG 1500 

25 AATCTGTTCA AGTTAGAATT ATCGGGCATA ATGATAAAGG TGAGTTAAAT GGTTCATTTT 156 0 

TACCACTTGC ACATGAACGT TTAGACGATG ACGGCCAAGT CATCTTTGAT TTACTAGTTG 162 0 

AATATGATGG TGAATTACCA TTCTGGGACA AATCAAGCCC TGAAGCGATT AAAGAAGTAT 16 80 

30 TCAATATGAG TAAAGGTTCA TTCAAACGTG CAATCGGTCA CTTATATAAA CAGAAGATTA 174 0 

TTAATATAGA AACAGGTAAA ATCGCTTTAA CTAAAAAAGG TTGGAGTCGA ATGGACTCAA 180 0 

AAGAATAATC ATTTTTACAC GTGTCGTAGG ATGCGTGTTT TTTTTATTCA ATATTAAATC 1860 

35 

GGACAGATGA AGTAGTTTTT TAAACATTCC TTTCAAAGTA AAAAATTAAA TAATTCAAAC 1920 

GAATAGGCTG GGaCATTAAG TTCTTAGGCA ATGTAAAAAA GCTGATTTCT ATTAATTATT 1980 

TGATGGAAAT CAGCTTTTTT GATATGTATT TTATAATGTA CAGCTCGTTG AGCTGCTATT 2040 

40 

TTCCTTATAT TAAGTGCCAT TAATACAAAA CCTAGCTCTC GTTTAACTTT ATTTATTCCT 2100 

CGAACTGACA TTCGAGTGAA aCCCAAAATA GCCTTCATAA ATCCAAAAAC AGGCTCTACA 2160 

4S TAAATTTTTC TATGACTATA GATTTTTTTC GTTTCTGGTT CAGAAAGCTT TTGaTTAATT 2220 

TGGGCTTTAA TGTATTTCAA AGTAAAATTA CATGTTAATA CGTAGTATTA ATGGCGAGAC 2280 

TCCTGAGGGA GCAGTGCCAG TCGAAGACAG GGGCCCCAAC ACAGAAGcTG ACATATAGTC 23 4 0 

SO AGCTTACAAC AATGTGCCGG TTGGGGTGGC TGAGACGGCA CCCTAGGAAG GGACCCGTCA 24 00 

TCAAAAATTC TATTTATAGA ATTTTACAGT AATGTGACAG ACGGGCAAAG CGAAgCCATT 24 60 

55 
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CTTACTGCTG TTTTTTTAGG GATTTATGTC CCAGCCATTT TTGTATTCAT ATTTAAATTT 2580 

CGATAATTTT TCAGGAAGCA TTTTAATTTT ACTAATGAAG CAATATTTTT TAGATTAACA 2640 

AAAATTAATA TTTACATTTT CTTAACAATT TTTTATGTAA CATTTACAGT TTCTAAAAAT 2700 

GAGGTTAATA ATTCAAGGTT AAGATAAAGA TGTAATCAAT ACAAATACTA TTTGTTGTTC 2760 

ATACAGGGAG GATATTTCAA TGAAAAAATG GCAATTTGTT GGTACTACAG CTTTAGGTGC 2 820 

AACACTATTA TTAGGTGCTT GTGGTGGCGG TAATGGTGGC AGTGGTAATA GTGATTTAAA 28 80 

AGGGGAAGCT AAAGGTGATG GCTCATCAAC AGTAGCACCA ATTGTGGAGA AATTAAATGA 294 0 

AAAATGGGCT CAAGATCACT CGGATGCTAA AAT CTCAGCA GGACAAGCTG GTACAGGTGC 3 000 

TGGTTTCCAA AAATTCATTG CAGGAGATAT CGACTTCGCT GATGCTTCTA GACCAATTAA 3060 

AGATGAAGAG AAGCAAAAAT TACAAGATAA GAATATCAAA TACAAAGAAT TCAAAATTGC 3120 

20 GCAAGATGGT GTAACGGTTG CTGTAAATAA AGAAAATGAT TTTGTAGATG AATTAGACAA 3180 

ACAGCAATTA AAAGCAATTT ATTCTGGAAA AGCTAAAACA TGGAAAGATG TTAATAGTAA 324 0 

ATGGCCAGAT AAAAAAATAA ATGCTGTATC ACCAAACTCA AGTCATGGTA CTTATGACTT 33 00 

25 CTTTGAAAAT GAAGTAATGA ATAAAGAAGA TATTAAAGCA GAAAAAAATG CTGATACAAA 33 60 

TGCTATCGTT TCTTCTGTAA CGAAAAACAA AGAGGGAATC GGATACTTTG GATATAACTT 342 0 

CTACGTACAA AATAAAGATA AATTAAAAGA AGTTAAAATC AAAGATGAAA ATGGTAAAGC 34 80 

AACAGAG CCT ACGAAAAAAA CAATTcAAGA TAACTCTTAT GCATTAAGTA GACCATTATT 354 0 

CATTTATGTA AATGAAAAAG CATTGAAAGA TAATAAAGTA ATGTCAGAAT TTATCAAATT 3600 

CGTCTTAGAA GATAAAGGTA AAGCAGCTGA AGAAGCTGGA TATGTAGCAG CACCAGAGAA 3660 

AACATACAAA TCACAATTAG ATGATTTAAA AGCATTTATT GATAAAAATC AAAAATCAGA 3720 

CGACAAGAAA TCTGATGATA AAAAGTCTGA AGACAAAAAA TAATAAGACG CAATTTCAAA 3780 

TGTGTCTTGA AACATGATTT TGATGGTGAA TCATTATTTA GAGTACAAAG CTTGATTTAT 384 0 

40 



30 



35 



CGAGACGCTG ATTTTGACAT TCAGTTAGTC TAcAAGCTTA TCAACTTAAA ATAGTGGTTC 3900 

ATCATTATTT TACAAATCTA ATTATTTTGG GAGTAATAGA AAGAGGTTTG ATTATGACTT 3960 

45 CATCTACTAA TGTTAAAGCT TTAATCGAAA AAAATAATAA TAAAAAAGGA AAGCATAATG 4020 

ACAAAATTAT ACCAGTTATT TTAGCCGCAA TTTCAGCGAT TTCCATTTTA ACAACACTAG 40 80 

GTATATTAAT CACATTGCTT TTAGAAACCA TCACTTTTTT CACCAGAATT CCAATAACTG 414 0 

so AATTTCTATT TTCTACTACT TGGAATCCTA CCGGTTCAGA CCCTAAGTTT GGTATCTGGG 42 00 

CATTGATAAT AGGGACTTTA AAAATCACAG TTATTGCGAC TATATTTGCA GTTCCAGTCG 42 60 



55 
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AACCGATATT AGAAATTTTA GCAGGAATAC CAACAATTGT GTTTGGTTTC TTTGCATTAA 4 380 

CCTTTGTTAC ACCAGTATTA AGATCTTTCA TACCAGGTCT TGGAGA G TTT AATGCTATAA 444 0 

5 GTCCCGGCTT AGTTGTCGGT ATTATGATTG TCCCTCTCAT CACAAGTTTG AGTGAGG a TG 4 500 

CAATGGCATC TGTACCAAAT AAAATTCGAG AAGGTGCCTA TGGACTTGGA GCAACTAAAT 4 560 

TAGAAGTAGC AACTAAAGTC GTACTTCCCG CAGCAACATC AGGTATTGTA GCTTCAATCG 4 620 

10 

TTCTCGCGAT TTCAAGAGCA ATTGGAGAAA CGATGATTGT AT CATTAG CG GCAGGTAGTT 4 680 

CGCCAACAGC TTCATTAAGT TTAACAAGTT CG ATT CAAAC AATGACTGGA TATATTGTTG 4 74 0 

AGATAG CG AC AGGTGATGCA ACATTTGGAT CAAATATTTA TTACAGTATT TATGCTGTAG 4 800 

75 

GGTTCACACT ATTTATCTTT ACCTTAATCA TGAATTTACT TTCTCAGTGG ATTTCTAAGC 4 860 

GTTTTAGGGA GGAGTATTAA TATGGAAACG ACAGATAATA ATAGACAATC ACTCGTCGAT 4 920 

2Q CAACAACTTG TCCAAAAACA TTTATCATCC AGAACGGTTA AAAATAAAGT GTTCAAACTC 4 980 

ATATTTTTAG CATGTACATT ATTAGGACTT GTCGTACTTA TTGCGTTGTT AACTCAAACA 504 0 

TTGATTAAAG GGGTAAGTCA TTTAAATTTA CAGTTTTTCA CTAATTTTTC TTCTTCAACA 510 0 

25 CCATCTATGG CTGG CGTTAA AGGCG CGTTA ATCGGTTCAC TTTGGTTAAT GTTAAGTATC 5160 " 

ATTCCATTAT CAATCATCCT AGGAATAGGT ACAGCTATAT ACTTAGAAGA AT ATG CG AAA 5220 ' 

AACAACAAAT TTACTCAGTT TGTTAAAATC AGTATTTCCA ATTTAGCTGG TGTACCATCA 5280 " 

30 GTTGTATTTG GGTTATTAGG TTATACTTTG TTCGTTGGTG GTGCAGGGAT TGAAGCCTTG 53 4 0 

AAAATGGGTA ACAGTATATT GGCAGCAGCG CTAACAATGA CCTTACTGAT ATTACCAATT 54 0 0 

ATTATTGTTT CAAGTCAGGA AGCAATTAGA GCTGTACCTA ACTCAGTACG CGAACTTcTT 54 6 0 

35 

ACGGCTTAGG TGCTAATAAA TGGCAAACGA TAAGACGTGT TGTCTTACCA GCAGCGTTAC 5520 

CTOSTATTTT AACTGGATTC ATTTTGTCTC TTTCAAGAGC ACTGGGAGAA ACAGCGCCAC 5580 

TTGTGCTAAT CGGTATACCG ACTATATTAT TGGCAACACC TAGAAGTATA TTGGATCAAT 564 0 

40 

TTTCAGCATT ACCTATCCAA ATATTTACTT GGGCGAAAAT GCCTCAAGAA GAATTCCAGA 5700 

ATGTTGCATC GGCAGGCATT ATCGTTTTAC TAGTTATCTT AATCTTAATG AATGGCGTTG 57 6 0 

4S CGATTATTTT ACGTAACAAA TTTAGTAAAA AATTCTAATT TAAACAATCA ATCTCATTTA 5820 

TCTATTAAAA AGGGAGTTTT AAATATGGCG CAAACACTTG CACAAACTAA ACAAATATCT 588 0 

CAAAGTCATA CGTTTGATGT CTCACAAAGT CATCATAAAA CACCAGATGA TACAAACTCA 594 0 

SO CATTCTGTTA TATATTCAAC ACAAAATTTA GACTTATGGT ATGGCGAAAA TCATGCATTA 6 000 

CAAAATATTA ATTTAGATAT TTATGAAAAC CAAATTACTG CCATTATAGG TCCATCTGGT 6060 

55 
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AAAACAGCTG GTAAAATATT AT AT CG AG AT CAAGACATTT TTGATCAAAA ATATTCTAAA " 6180 

GAACAATTAC GTACAAATGT GGGCATGGTC TTTCAACAAC CTAATCCATT TCCAAAATCA 624 0 

5 ATATACGATA ATATTACTTA CGGTCCAAAG ATTCACGGTA TTAAAAATAA AAAAGTTCTT 63 00 

GATGAAATCG TTGAGAAATC ATTACGTGGC GCTGCAATTT GGGATGAATT AAAGGATAGG 6360 

TtGCACACAA ATGCATATAG TTTATCCGGT GGGCAACAAC AACGTGTTTG TATCGCGCGT 6420 

W 

TGTTTAGCAA TTGAACCTGA AGTCATTTTA ATGGATGAAC CGACATCAGC ATT AG AT C CA 64 80 

ATCTCAACAT TAAGAGTAGA AGAGTTGGTT CAAGAACTAA AAGAAAAGTA TACAATTATT 6 540 

ATGGTtACAC AT AATATG CA ACAAGCAGCT CGTGTATCAG ATAAAACTGC ATTTTTCTTA 66 00 

75 

AATGGTTATG TCAATGAATA TGATGATACT GATAAAATTT TCTCTAACCC ATCAAACAAG 6660 

AAAACAGAAG ATTATATTTC AGGAAGGTTT GGTTGATATA TAATGGCAAT AATTAGACAA 6720 

2Q * CGATATCAGG AGCAACTTGA TGATTTAATA AAAGAATTAC GTCGGTTAGG TGCaAATGTC 6780 

TATGTGAGTA TTGaAAATGG TATAAAAtCA TTAAGTATTG aCGATAGAGG C TTTGCACG A 684 0 

CAAACAGTTA AAAACGATAA ACATATCAAT CAATTAAATT ATGATATTAA TGAGCGAGTT 6900 

25 ATCATGTTAA TTACAAAGCA ACAGCCCATT GCGAGTGATT TGCGTATGAT GATTTCTTCA 6 960 

TTAAAAATCG CCTCCGATTT AGAAAGAATA GGAGATAATG CCTCGAGTAT TGCCAATATT 7 020 

CGATTGCGTA CAAAGATTAC AGATGATTAT GTGTTAACCC GTTTAAAGAC AATGGGTAAA 70 80 

30 TTAGCTATGT TAATGTTAAA GGACTTAGAT CAAGCATTTA AAAAGAAAGA TACCGTATTA 7140 

ATAAGAGAAA TAATTGAGCG TGATGAAGAT ATCGATGACT TATATAGTCA TATTATTAAC ' 7200 

GCAACGTATC TTATTGATAA CGtCCATTTG TCGCTGCACA AGCTCATTTA GCAGCAAGAC 7260 

35 

ATTTAGAACG TATTGGTGAT CATATTATTA ACATCGCTGA AAGTGTTTAT TTTTATTTAA 7320 

CAGOTACACA TTACGAACAA TAACTTAAAG TTATTACTAT AAAATCCCTT ACGATAAATA .7380 

TATATTTCTA TTATTCATAA ACCCTCAAAA AAACCAAGAT TCTCACAATT AGTAATGTGA 744 0 

40 

AAATCTTGGT TTATAlTCTl^ CTACT ' TTGCTTCCTC 7500 

AATTTCATCT GTTAATTTTT CAACTTCATC GACTAAATCA GAAATATATT GAATTGTAGA 7560 

TTTAAGTGGC TGTTCTGTAG TAATGTCTAC ACCTGCAATG TTTGCAAGTT CGACAGGTGA 7620 

45 

TACACTACCA CCTTTTTTCA ATGTTTCTAA CCAAGCATCA ACAGCTGGTT GGCCTTCATT 76 80 

TTTAATCTTT TGAGAAACGA CAGTTCCGAT TGTTAAGCCA GCAGAATACG TATACGAATA 774 0 

SO TAATCCCATA TAGTAATGAG GTTGACGCAT CCATGTTAAT TCAGCACCCT CAGTCATGTC 7 800 

TACTGCATCT CCAAAAAATT GTTTATAAAC ATTTAGCATT ATTTCATTTA ATGTn CGGCG 7 860 

55 
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(2) INFORMATION FOR SEQ ID NO: 162: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 798 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDN ESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 162: 





TTTTTTCTTT 


TCTTCATTTG 


AAAATTGATC 


ATTCAGCAAT 


ATAAGCGTAT 


TTGTTAATGA 


60 


15 


TTTAGGTGTT 


CCAATTTCAT 


AATCCCACCA 


ATTTAAGTTG 


GTATTCTTGC 


CAGTTGTTTT 


120 




AGTAAAATTC 


TCACTTAATT 


CTTTTACTTT 


TTTATCTGGT 


TcrrrrccAT 


ATGCATTTTT 


180 








LI 1 1 UnU X x A 


PTTPTT1TTT 
v_> x l\~ ± in x x x 


X WSJ X W-rtW X *% X 


X X f\J^^\\J X X 




20 


TTTAGGATTC 


CTCATCGCTT 


CTGCGATTTT 


CTCAATATTA 


CGATAGGTAC 


GAGTCATATG 


300 




AGAAGAATTA 


GTTTCAAGGG 


TTTCCGCTCC 


TGACCACAAG 


TATTTCCTAC 


CACTTTCAGT 


360 




TTTCATTTCC 


TTGAGTAAAT 


TCGTCGCCTC 


TTTCTCTGTA 


GCATCAAACT 


TCTTCTTCAT 


420 


25 


AT CTGGATT A 


TTCTCATCAT 


ACTTATCATA 


ACCATAGTTA 


ACGTCCAGCC 


ATGTGTTCCT 


480 _ 




CAATTTTTCA 


TAATCTGGCG 


TTTGAACATT 


CGTATCAGCC 


ACAGCGATTT 


GATGTTTATC 


540 




AACACTTCTG 


AATTCACCAC 


CATTCAAAGT 


AATCACACCA 


GCCATTAATA 


ACGTAATGGT 


600 


30 


GGATAATTTT 


TGCCATTTCT 


TTATTCTATA 


TGTCATTGaC 


ATGTCTCCTT 


TTTGTGTTGC 


660 




GCGTGCGCAA 


TGAATATTAT 


GATTAAATAA 


TGATTCAATT 


TTTCAAAATT 


CGTTAACGTA 


720 


35 


TACAAATGAC 


TGTCTACTGT 


CAAACAATCC 


ACAAAGAATG 


TTGATGt. CAT 


ATaAACAATC 


780 ... 


GATCACCCAA 


ATTTTCCG 










798 



(2) .INFORMATION FOR SEQ ID NO: 163: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5132 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 163: 

TACAGGTTTT ACTATAATGG ATGGTATTTT GG CT AAACG A CATTGGTTTA GTCTTCTTTT 6 0 

TTTnACTTCC TAnATTTACA ATGGTATAAA TAATAATGCT ATATTTAGAA TGATGAGTAT 120 

ACTTACTGAA ACTAAATTAA AAGTGTCTGG TTCTTTACTA AAGATAGCTG CTATCCTTGC 180 
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AATACAAGTT CCAATGAGCG CAATTAAAAG TACTAACCCA ACGATGAAAC TCTGTTTGTC ~ 300 

ACTTAACTCA AAGAAACTAT AGATAGGATA TTTTTTAATA ATCAAGCCAC CTAAAATCAT 360 

CCATAAAAAT ACGATAATTC CATAAGTCAC ATTTATAACA TACGTTATTT TTTGGTCACC 420 

AAATCGGACT AATGTATTTC GTAGAATCAG CATACCAATG ACAACACCTA AAATAACGAT 4 80 

ACT AG CT AT A TAAAGTAAAA ATGCAATTGT CACATCAAAT GTACCCAAAT CTAAAAACCT 540 

AGGAATTAyA AyGACTGCTA AAATAAAAGC GAAGyACAAA GTAATATAkT TATACAAACC 6 00 

GGTAGTAAGA CTTATCTCAG GTGATAATTG ATCAGC CATT GACTTAATCG GTGTATTAAT 660 

AATTGAACTT GTATCTTCGT TATTTTTTTC AGC CATAGTT AAATGATCTT CGAGCTCTTC 720 

CAATAACTCT TCTACTTCTG CTTCAGTCTT ACCTCTAAAT AACAATTCAA CACGTAATTT 780 

TTCTAAAAAA TCTTGAGATT GTTTACTTAA CATCGTTTTC CCCTCCAAAC AAGTTAATCA 840 

TCCCTTTATT CAAAACTTGC CATTTCGATT TAAATACTTT TAGTTCCTTT AAACCTGAAT 900 

CGGTAATCGT ATAGTATTTC CGCCTCGGGC CGCCATTACT AGATTTTTTT ATTGTCGTAT 960 

CAACGTATCC TTTTTTGTTT AAACGCATTA AAACTGGATA AATACTACCC TCACTTATCT 1020 

2$ CTGGAAACTC TTGATTCTTA AGTTTCGTCA TAATTTCATA TCCATACGTT TCGCCTTGGG 108 0 

GAATGAGACC TAATATCGCC CCATCTAAGA GACCTTTCAT AATCTGATCT GACACTGACA 1140 

TTTTAATCAC CTACTATCTT ACATAATAAG ATAGTACATT GAGAACTTTT CGTCAACTAT 1200 

30 C TTTTATTGT AAGGTAGTTG TTGTACACAT TCCTTAAATG ACTAACAACT TTGTTAATAG 1260 

GGTAATACTT ACGGAAGTAT ATTTTATTTA TGGGGGAGGA ATTAATAATG ACTACAAAAA 1320 

CAGTATTTGA TGTCATTGAT ATGGGGTTAG GATATTTAGT AAATGTGTAT GATGCTTGGA 1380 

AAGTTGAAAA GGTACTTGAT GATTATCATA AGCCTTTTTC TAATACCATT CATTGGCAAT 1440 

TTGGt CATGT ATTAACAATT TTTGAATCGG CCTTAGCTGT TGCTGGTAAA GAGAATATTG 1500 

ATTTAAATAT CTATAGACCT TTATTCGGAA ATGGTTCGTC TCCAGATGAA TGGAAGGATG 1560 

~ AAGTACCGAG - TATTGAAAGG~ATTTTAGAAG ~ GTCTCCAAAC -TTTACGTGAA— GGTGGAGGAA 1620 

ATCTAACTGA AGATGATTTA GCAATTGAAT TGAAACAGCC AATTGTCGGT TGTAATAACT 1680 

TAGAAGAGTT ATTAGTATTA AATGCCATTC ACATCCCACT TCATGCTGGT AAAATTGAAG 174 0 

AGATGTCTCG TATATTAAAA AATTTAAAAT AAATATGTGC TTATTAACCG TTAACAACAC 1800 

GTTAACGGgT TTTTTATTTG TTTAAAAGGT CACTTTTTTG AATTTAATAA ACACGATCTA 1860 

So TACCAGTTCT TCACCGATTC TCGAAAAATA ATTATATTAA TGATTTCGTT AATTTAATTT 1920 

TATATTTAAT TATTACTGTA CATCTTTTGT AGTTAGCTTT ATTCTTAAAT TGAAATATGT 1980 
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TACTCCCTAT 


CGTTGTAGGT 


CTCCTTATTT 


GGGCACTTAC 


accttttaaa 


CCGGATGCTG 


2100 




TGGATCCAAC 


AGCATGGTAT 


ATGTTCGCAA 


TATTCGTCGC 


GACAATCATT 


G CTTGT ATT A 


2160 


5 


CACAACCGAT 


GCCAATTGGG 


GCCGTCTCTA 


TAATTGGATT 


TACAATCATG 


GTACTCGTTG 


2220 




GCATTGTTGA 


CATGAAAACG 


GCTGTCGCTG 


GTTTTGGTAA 


TAATAGCATT 


TGGTTAATTG 


2280 


10 


CTATGGCATT 


TTTCATTTCG 


AGAGGATTTG 


TGAAAACAGG 


TCTTGGTAGA 


CGTATCGCAC 


2340 


TTCATTTCGT 


CAAATTATTT 


GGTAAAAAAA 


CATTAGGATT 


AGCATATTCT 


ATCGTCGGTG 


2400 




TAGATTTAAT 


TCTAGCGCCT 


GCTACACCAA 


GTAATACCGC 


GCGTGCTGGT 


GGAATCATGT 


2460 


15 


TCCCAATTAT 


CAAATCACTT 


TCTGAATCAT 


TTGGTTCGAA 


ACCGAAAGAC 


GGATCAGCAC 


2520 


GCAAAATGGG 


TGCATTTCTT 


GTTTTCACAG 


AATTCCAAGG 


TAATTTAATT 


ACTGCGGCTA 


2580 




TGTTTTTAAC 


TGCAATGGCC 


GGTAACCCCC 


TTGCACAAAA 


TTTAGCATCT 


AGCACATCTA 


2640 


20 


ATGTTCACAT 


TACATGGATG 


AATTGGTTTC 


TAGCTGCTTT 


AGTTCCTGGA 


CTTGTTTCCT 


2700 




TAATTGTTGT 


ACCTTTTATT 


ATTTATAAAA 


TTTATCCACC 


AACTGTTAAA 


GAAACACCAA 


2760 




ATGCTAAGAG 


TTGGGCTGAA 


AATGAATTAG 


CGACTATGGG 


TAAAATCGCT 


TTAGCTGAAA 


2820 


25 


AATTTATGAT 


TGGTATTTTT 


GTCGTTGCGT 


TAACACTATG 


GATTGTCGGA 


AGTTTCATTC 


2880 




ATATTGATGC 


AACTTTAACG 


GCCTTTATTG 


CGCTAg C ATT 


gTTATTATTG ACAGGCGTCT 


2940 




TAACATGGCA 


AGACATTTTA 


AACGAAACAG 


GTGCTTGGAA 


CACATTAGTA 


TGGTTCTCAG 


3000 


30 


TATTAGTGTT 


AATGGCCGAC 


CAATTAAACA 


AGCTTGGATT 


TATTCCTTGG 


TTAAGTAAAT 


3060 




CCATTGCTAC 


AAGTCTTGGT 


GGCTTAAGCT 


GGCCTATAGT 


CCTGGTCATT 


TTAATATTGT 


3120 


35 


TCTACTTCTA 


TTCACATTAC 


TTATTTGCAA 


GTTCTACAGC 


ACATATCAGT 


GCGATGTATG 


3180 


CAGCATTACT 


AGgCGTTGCC ATCGCAGCCG 


GTGCACCACC 


ATTATTCAGT 


GCATTAATGT 


3240 




TAGGTTTCTT 


CGGTAACCTA 


TTAGCTTCAA 


CAACACACTA 


TAGTAGTGGT 


CCAGCGCCGA 


3300 


40 


TTCTATTCTC 


TTCAGGTTAC 


GTGACTCAAA 


AACGTTGGTG 


GACAATGAAC 


TTAATATTAG 


3360 


GTTTCGTCTA 


CTTTATTATC 


TGGATTGGTT 


TAGGATCACT 


TTGGATGAAA 


GTAATTGGTA 


3420 




TATTTTAAAA 


TATTTAAATT 


AGCGCTCGAA 


TCTCATTGAT 


TTGGGCGCTT 


TTTAATTTGT 


3480 


45 


ATTTAAAATC 


AACCTTTGCT 


AAATCAAGAC 


tcclttitta 


AAATACGTTT 


ATCCTTTAAA 


3540 




TCATTGCGTG 


CTTCACTGAA 


AATTTGTATA 


AAGATTTAAG 


TCATTACGTA 


ACATCACATA 


3600 




AAATACATTT 


CTATACTATT 


CCGCTTCATT 


GATTAACATT 


ACGTATGCCC 


TCATAAATCA 


3660 


SO 


TCATACAAAA 


AACACCTTCG 


TTTAAATTCA 


TTTTAATTGC 


GAATTCAACG 


AAAGTGCCTT 


3720 




ATTTCATATT 


TAATGTTTCA 


AATTTATACG 


TCTGTCACTG 


TTACTGCACA 


CATACCTCAG 


3780 
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35 



TTATAGGGTT 


TTTG CGACCG 


GATGTTTCTT 


CAATTTAATG 


TATTGAGAAA 


GACTATATAA 


3900 


\~J\\~J\£\ 1 ALL 1 


O ILLAAATAA 


ATATAAACGT 


AATTAATTGA 


TCTATACTAA AAGGCTCTTT 


3960 


a. 7A 7A 7A.l"*7A IV AT 
vtAAAAwtAAi 


A Ivj v_ VJG AG T A 


CAAACATTAT 


TGTTGGTCCA 


ACGTATTGAA 


TAAATCCTAT 


4020 


1 ALj v_ LaAAAtj x 


GGAATACGTT 


TTGCCCCGGC 


TGAGAATAGG 


ATTAGTGGTA 


TTGCCGTAAT 


4 080 


AG CACCAGAA 


AATAACAACC 


AAAATGATGA 


CATGTTCAAT 


CCAAATGACA 


TCTGATGTTG 


4140 


LA\a CAT AAA 


TAAATAACGT 


ATATTAGTCC 


AGCAGGTGCG 


GTAACAATAC 


ATTCAATCGT 


4200 


AATACTGCTG 


ATGGCATCAA 


TATGTACTAC 


TTTTrrCAAT 


AATCCGTATG 


TACCAAAGGA 


4260 


TAACGCTAAT 


ATAATAGAGA 


CGATTGGGAA 


TTCTCCAATC 


TTGAGCGTCA 


TATATAATAC 


4320 


ACCGATGAAT 


GCGAATAAAA 


TGGCTAGCCA 


TTCAAATTTA 


TTGAATCTTT 


cttttaaaaa 

W AAA AfV^fV^C^ 


4380 


. GATAAGTGCG 


AG CAAAATGC 


TAACAAGTGG 


ATTTATATAA 


TAAC CTAAAC 


J l u I l ti"i~i~i'r •'I'll ("2 


4440 


GACGTGACCG 


TTCGTTACAG 


CCCAAATAAA 


TGTACCCCAA 


TTTAATGTAA 


TGACATAGPC 


4500 


TGCTACGACA 


ATCGCTAATA 


GCTGAATGGG 


CTTGCCTAAC 


AATTGATT CA 


TATCTCGTTG 

A A \* A ^wVJ A A VJ 


4560 


AAATGCATTG 


CGTTGTTTTT 


GTCCAACCGC 


GAGTATGAAA 


ATCATGAATA 


TTGCTGAAAA 


4620 


TATAATACGA 


AAGGCTAAAA 


TTTCAAATGC 


GCCTATTGCA 


TCAACGAACT 


GCCAATATAT 


4680 


AGGTAGTATT 


CCCCACAGAA 


TGTATGCACT 


GAGTGCTAAA 


AATATGCCTT 


TTTTATACTC 


4740 


TGAATTCACC 


TTCAAAC CTC 


CTTACTTTCC 


TAATaTTTAA 


TTTACTGCAT 


ACGCTGACTT 


4800 


GGTTATGCTA 


ATATAACGAT 


TTTACTAATA 


ATATTTCGAT 


AAAGATATCA 


TTTTGTTTAT 


4860 


ATTTCCCACA 


TTTATTCACC 


AACCACTAAA 


CAATATTAAT 


TTTATAAATA 


ATTCTGTACA 


4920 


AATCAGGGTA 


TATTGCCAGA 


AAGACTACCA 


TACAACATAA 


AGGATGGATA 


CAAATGACTT 


4980 


TACCTAAAAT 


TGGAAAGCCT 


GCAAGACGCG 


CGCTAAATTC 


AGAAGGT AT A 


TACACATTAG 


5040 


AAGOAGTATC 


ACAATATACG 


AAGTCATCTC 


TAATGGAGAT 


GCATGGCGTT 


GGTCCTAAAG 


5100 


CTATATCAAT 


ATTGGAACAA 


GCTTTATTTC 


AG 






5132 



40 

(2 ) INFORMATION" FOR SEQ ID NOT 164 : 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 22243 base pairs 
45 (B) TYPE: nucleic acid 

(C) STRAND EDN ESS : double 

(D) TOPOLOGY: linear 



50 <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 164: 

AAGTAAATTA TATTATGAAT TTGCCTGTCA ATTTCTTAAA GACATTCTTA CCGGAACTAA 60 
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w 



15 



TAGAAGCAAT TAATAATGCy mAAGAAAAGA CAGCTAATAA TACCGGCTTA AAATTAATAT 180 

TTGCAATTAA TTATGGTGGC AGAGCAGAAC TTGTTCATAG TATTAAAAAT ATGTTTGACG 24 0 

AGCTTCATCA ACAAGGTTTA AATAGTGATA TCATAGATGA AACATATATA AACAATCATT 300 

TAATGACAAA AGACTATCCT GATCCAGAGT TGTTAATTCG TACTTCAGGA GAACAAAGAA 3 60 

TAAGTAATTT CTTGATTTGG CAAGTTTCGT ATAGTGAATT TATCTTTAAT CAAAAATTAT 4 20 

GGCCTGACTT TGACGAAGAT GAATTAATTA AATGTATAAA AATTTATCAG TCACGTCAAA 4 80 

GACGCTTTGG CGGATTGAGT GAGGAGTAGT ATAGTATGAA AGTTAGAACG CTGACAGCTA 54 0 

TTATTGCCTT AATCGTATTC TTGCCTATCT TGTTAAAAGG CGGCCTTGTG TTAATGATAT 600 

TTGCTAATAT ATTAGCATTG ATTGCATTAA AAGAATTGTT GAATATGAAT ATGATTAAAT 660 

TTGTTTCAGT TCCTGGTTTA ATTAGTGCAG TTGGTCTTAT CATCATTATG TTGCCACAAC 720 

20 ATGCAGGGCC ATGGGTACAA GTAATTCAAT TAAAAAGTTT AATTGCAATG AGCTTTATTG 780 

TATTAAGTTA TACTGTCTTA TCTAAAAACA GATTTAGTTT TATGGATGCT GCATTTTGCT 84 0 

TAATGTCTGT GGCTTATGTA GGCATTGGTT TTATGTTCTT TTATGAAACG AGATCAGAAG 900 . 

25 GATTACATTA CATATTATAT GCCTTTTTAA TTGTTTGGCT TACAGATACA GGGGCTTACT 960 

TGTTTGGTAA AATGATGGGT AAACATAAGC TTTGGCCAGT AATAAGTCCG AATAAAACAA 1020 

TCGAAGGATT CATAGGTGGC TTGTTCTGTA GTTTGATAGT ACCACTTGCA ATGTTATATT 10 80 

TTGTAGATTT CAATATGAAT GTATGGATAT TACTTGGAGT GACATTGATT TTAAGTTTAT 114 0 

TTGGTCAATT AGGTGATTTA GTGGAATCAG GATTTAAGCG TCATTTCGGC GTTAAAGACT 1200 

CAGGTCGAAT ACTACCTGGA CACGGTGGTA TTTTAGACCG ATTTGACAGC TTTATGTTTG 126 0 

TGTTACCATT ATTAAATATT TTATTAATAC AATCTTAATG CTGAGAACAA ATCAATAAAC 1320 

GTAAAGAGGA GTTGCTGAGA TAATTTAATG AATCTCAGAA CTCCTTTTGA AAATTATACG 13 80 

CAATATTAAC TTTGAAAATT ATACGCAATA TTAACTTTGA AAATTAGACG TTATATTTTG 144 0 

TGATTTGTCA GTATCATATT ATAATGACTT ATGTTACGTA TACAGCAATC ATTTTTAAAA 1500 

TAAAAGAAAT TTATAAACAA TCGAGGTGTA GCGAGTGAGC TATTTAGTTA CAATAATTGC 1560 

45 ATTTATTATT G TT T TTG GTG TACTAGTAAC TGTTCATGAA TATGGCCATA TGTTTTTTGC 1620 

GAAAAGAGCA GGCATTATGT GTCCAGAATT TGCGATCGGT ATGGGGCCAA AAATTTTTAG 1680 

TTTTAGAAAA AATGAAACAC TTTACACTAT TAGGTTATTG CCTGTTGGTG GATATGTTCG 1740 

50 TATGGCAGGA GATGGCTTAG AAGAGCCACC AGTCGAGCCC GGTATGAACG TTAAAATTAA 1800 

ACTTAATGAA GAAAATGAAA TAACACATAT CATATTAGAT GATGATCATA AGTTTCAACA 1860 
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CACTGCTTAT GATAATGAAA GACATCATTT 
AAATGGTAGC TTAGTTCAAA TTGCTCCGAG 
5 GCCGAAATTT TTAACATTAT TTGCGGGACC 

ATTTATTGGT CTTGCATATT ATCaAGGcAC 
TAAGTATCCA GCTCAACAAG CAGGATTACA 

10 

ATATAAAATA TCTGAATTTG ATGATGTTGA 
GACGACTGTT AAATTTGAAC GTGATGGTAA 
GACTGAAAAA AAACTGACTA AAGTAAGTTC 

15 

AGCGAGTGAA CATACACTTT TTAAACCAAT 

TAGTACTTAT ATTTTTACAG CTGTAGTAGG 
20 CTCATTTGAT ATGTTAAATG GTCCGGTTGG 

AGCGGGTATC ATTAGCTTAA TTGGTtnCAC 
GAATTTAATT CCTATTCCTG CACTAGACGG 
25 GATTTTCAGA AAACCAGTTA ATAAAAAAGC 

TTTCATGGTC GTTATAATGA TATTAGTAAC 
ATTTAGGAGG ATAAATAATT ATGAAGCAAT 

30 

TGCCATCAGA AGCAGAAGCA CAAAGTCATC 
AAAGTACAAG TGGGATTTAT AGTTATTTAC 
CTGCAATTGT GCGACAAGAA ATGGAACGTA 

35 

TACAACAAGC TGAATTATGG GAAGAATCAG 
TGCGTTTACA AGATAGaCAT GGAAgACAAT 
TTACATCAAT AGTAAGAAAT GAATTGAAAT 

40 

aAATTCAATC TflAATTCCGT ^C^TGAAAAGA" 
ATTTATTATG AAAGATGCAT ATTCATTCCA 

45 TCAAGATATG TATCAAGCGT ATAGCCGTAT 

AGTAGTTGCA GATTCAGGTG CTATAGGCGG 
TGCTATCGGT GAGGATACAA TCGTTTACAG 

50 AAAAGCAGAA GTCGTTTACG ArcCAaATcA 

AATTGAAACA CCAAATGTTA AGACTGCGCA 

55 
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TAAAATTGCT 


AGAAAGTCTT 


TCTTTGTTGA 


1980 


AGACAGACAA 


TTTGCACATA 


AAAAGCCATG 


2040 


GTTATTTAAC 


TTTATATTAG 


CTTTAGTCCT 


2100 


GCcTACGTCT 


ACTGTAGAAC 


AAGTCGCAGA 


2160 


AAAAGGTGAT 


AAGATCGTCC 


AAATTGGCAA 


2220 


TAAGGCGTTA 


GATAAAGTTA 


AAGATAATAA 


2280 


AACAAAGTCA 


GTTGAATTAA 


CACCTAAAAA 


2340 


AGAGACGAAG 


TATGTTCTCG 


GATTCCAACC 


2400 


TGTATTCGGA 


TTTAAAAGCT 


TTTTAATCGG 


2460 


TATGTTGGCT 


AGTATATTTA 


CGGGCGGATT 


2520 


TATTTATCAT 


AACGTCGACT 


CAGTTGTTAA 


2580 


TGCGTTATTA 


AGTGTAAACT 


TAGGTATTAT 


2640 


TGGTCGTATT * 


TT ATTTGTTA 


TATATGAAGC 


2700. 


GGAAACAACG 


ATTATTGCTA 


TTGGTGCCAT 


2760 


GTGGAATGAT 


ATTCGACGAT 


ATTTCTTATA 


2820 


CCAAAGTTTT 


TATACCAACG 


ATGCGTGACG 


2880 


GTTTATTATT 


GAAATCGGGT 


TTGATAAAAC 


2940 


CGCTAGCAAC 


ACGTGTGTTA 


AATAATATTA 


3000 


TCGATTCTGT 


TGAAATTTTA 


ATGCCAGCGT 


3060 


GACGTTGGGG 


TGCATATGGC 


CCAGAATTAA 


3120 


TTgCATTAGG 


TCCaACACAT 


GAAGAATTAG 


3180 


CATACAAACA 


ATTACCGATG 


ACATTATTCC 


3240 


GACCACGTTT 


TGGTTTAyTC 


^GTGGGCGTGA 


330<T 


TGCTGACGAG 


GCATCATTAG 


ATCAAACGTA 


3360 


TTTTGAGAGA 


GTTGGCATTA 


ACGCAAGACC 


3420 


TAGCCATaCA 


CATGAATTTA 


TGGCATTAAG 


3480 


TAAAGAAAGT 


GATTATGCTG 


CTAACATCGA 


3540 


TaAGCATACT 


ACTGTGCAAC 


CTTTAGAAAA 


3600 


AGAATTGGCA 


GACTTCTTAG 


GTAGACCAGT 


3660 



BNSOOCIO: <£P 078651 9A2_I_> 



802 



EP 0 786 519 A2 

GCGTGGCCAT CATGAAATTA ATGACATTAA ATTAAAATCT TATTTCGGCA CAGATAATAT 3780 

TGAATTAGCA ACACAAGACG AAATTGTTAA TTTAGTTGGT GCAAATCCTG GTTCACTAGG 3 840 

5 TCCTGTAATT GATAAAGAAA TCAAAATTTA TGCAGATAAT TTTGTGCAAG ATTTAAATAA 3900 

TTTAGTTGTC GGTGCTAACG AAGATGGTTA TCACTTAATT AATGTAAATG TAGGTAGAGA 3960 

CTTCAACGTT GATGAATATG GCGATTTCCG TTTTATTTTA GAAGGCGAAA AGTTAAGTGA 4 020 

10 TGGTTCAGGC GTTGCACATT TTGCTGAAGG TATTGAAGTT GGTCAAGTAT TCAAATTGGG 4 0 80 

TACTAAGTAT TCAGAATCAA TGAATG CTAC ATTCTTAGAT AACCAAGGAA AAGCTCAATC 4140 

TTTAATTATG GGTTGTTACG GAATTGGAAT TTCTAGAACG CTAAGTGCGA TTGTTGAACA 4 200 

AAATCACGAT GATAATGGAA TTGTTTGGCC TAAATCAGTT ACTCCGTTTG ATTTACATTT 4 260 

AATTTCTATT AATCCTAAGA AAGATGATCA ACGAGAACTA GCAGATGCAC TATATGCTGA 4320 

ATTTAATACT AAATTTGATG TGTTGTACGA TGATCGTCAG GAACGTGCAG GTGTTAAATT 43 8 0 

20 

TAATGATGCC GATTTAATTG GTTTACCACT GCGAATTGTT GTTGGTAAAC GTGCATCGGA 444 0 

AGGTATTGTA GAAGTTAAAG AACGTTTAAC AGGTGATAGC GAAGAAGTTC ACATTGATGA 4 500 

25 CTTAATGACT GTCATTACAA ATAAATATGA TAACTTAAAA TAATTAAGAT CGAATGAATT 4560 

ATAAGAGTAG GAAAAAGCTG AAAGAAATCT GATGCTTATG TCCTGCTCTT ATTATTTTTG 4620 

ATATAATGAT TATTCGATGA AAAATGACTG AAGACATAGT ATAATTAAAG ATAAATTTGT 4680 

30 TTTAACAATA TAATGATTAG C CAAAT AT AA AGCATTTAAT TTTCTATCAT TACTATGCTC 474 0 

ACATAATCTA AATATTGTTC GAACACGTAA AAGTAATTTC TATTTAAGGT GGTAATTGTC 4800 

TTGGCAATGA CAGAGCAACA AAAATTTAAA GTGCTTGCTG ATCAAATTAA AATTTCAAAT 4860 

35 CAATTAGATG CTGAAATTTT AAATTCAGGT GAACTGACAC GTATAGATGT TTCTAACAAA 4920 

AACAGAACAT GGGAATTTCA TATTACATTA CCACAATTCT TAGCTCATGA AGATTATTTA 4 980 

TTATTTATAA ATGCAATAGA GCAAGAGTTT AAAGATATCG CCAACGTTAC ATGTCGTTTT 5040 

40 

ACGGTAACAA ATGGCACGAA TCAAGATGAA CATGCAATTA AATACTTTGG GCACTGTATT 5100 

GACCAAACAG CTTTATCTCC AAAAGTTAAA GGTCAATTGA AACAGAAAAA GCTTATTATG 5160 

TCTGGAAAAG TATTAAAAGT AATGGTATCA AATGACATTG AACGTAATCA TTTTGATAAG 5220 

45 

GCATGTAATG GAAGTCTTAT CAAAGCGTTT AGAAATTGTG GTTTTGATAT CGATAAAATC 528 0 

ATATTCGAAA CAAATGATAA TGATCAAGAA CAAAACTTAG CTTCTTTAGA AgCACaTATT 534 0 

SQ CAAGAAGAAG ACGAACAAAG TGCACGATTG GCAACAGAGA AACTTGAAAA AATGAAAGCT 54 00 

GAAAAAGCGA AACAACAAGA TAACAACGAA AGTGCTGTCG ATAAGTGTCA AATTGGTAAG 5460 
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GCAATAGAGG GTGTCATTTT TGATATAAAC TTAAAAGAAC TTAAAAGTGG TCGCCATATC 5580 

G T AG AAATT A AAGTGACTGA CTATACGGAC TCTTTAGTTT TAAAAATGTT TACTCGTAAA 5640 

5 AACAAAGATG ATTTAGAACA TTTTAAAGCG CTAAGTGTTG GTAAATGGGT TAGGGCTCAA 5700 

GGTCGTATTG AAGAAGATAC ATTTATTAGA GATTTAGTTA TGATGATGTC TGATATTGAA 57 6 0 

GAGATTAAAA AAGCGACAAA AAAAGATAAG GCTGAAGAAA AG CGTGTAG A ATTCCACTTG 5820 

10 

CATACTGCAA TGAGCCAAAT GGATGGTATA CCCAATATTG GTGCGTATGT TAAACAGGCA 5 880 

GCAGACTGGG GACATCCAGC CATTG CGGTT ACAGACCATA ATGTTGTGCA AGCATTTCCA 5940 

GATGCTCACG CAGCAGCGGA AAAACATGGC ATTAAAATGA TATACGGTAT GGAAGGTATG 600 0 

15 

TTAGTTGATG ATGGTGTTCC GATTG CAT AC AAACCACAAG ATGTCGTATT AAAAGATGCT 6060 

ACTTATGTTG TGTTCGACGT TGAGACAACT GGTTTATCAA ATCAGTATGA TAAAATCATC 6120 

2Q GAGCTTGCAG CTGTGAAAGT TCATAACGGT GAAATCATCG ATAAGTTTGA AAGGTTTAGT 6180 

AATCCGCATG AACGATTATC GGAAACGATT ATCAATTTGA CGCATATTAC TGATGATATG 6240 

TTAGTAGATG CCCCTGAGAT TGAAGAAGTA CTTACAGAGT TTAAAGAATG GGTTGGCGAT 6300 

25 GCGATATTCG TAGCGCATAA TGCTTCGTTT GATATGGGCT TCATCGATAC GGGATATGAA 6360 

CGTCTTGGGT TTGGACCATC AACGAATGGT GTTATCGATA CTTTAGAATT ATCTCGTACG 6420 

ATTAATACTG AATATGGTAA ACATGGTTTG AATTTCTTGG CTAAAAAATA TGGCGTAGAA 64 80 

30 TTAACGCAAC ATCACCGTGC CATTTATGAT ACAGAAGCAA CAGCTTACAT TTTCATAAAA 654 0 

ATGGTTCAAC AAATGAAAGA ATTAGGCGTA TTAAATCATA ACGAAATCAA CAAAAAACTC 6600 

AGTAATGAAG ATGCATATAA ACGTGCAAGA CCTAGTCATG TCACATTAAT TGTACAAAAC 6660 

35 CAACAAGGTC TTAAAAATCT ATTTAAAATT GTAAGTG CAT CATTGGTGAA GTATTTCTAC 6720 

CGTAGACCTC GAATTCCACG TTCATTGTTA GATGAATATC GTGAGGGATT ATTGGTAGGT 6780 

ACAGCGTGTG ATGAAGGTGA ATTATTTACG GCAGTTATGC AGAAGGACCA GAGTCAAGTT 684 0 

40 

GAAAAAATTG CCAAATATTA -TGATTTTATT - GAAATTCAAG - GAGGGGCAGT TTATGAAGAT 6900 

TTAATTGATA GAGAGCTTAT TAGAGATACT GAAACATTAC ATGAAATTTA TCAACGTTTA 6960 

ATACATG CAG GTGACACAGC GGGTATACCT GTTATTGCGA CAGGAAATGC ACACTATTTG 7020 

45 

TTTGAACATG ATGGTATCGC ACGTAAAATT TTAATAGCAT CACAACCCGG CAATCCACTT 7080 

AATCG CTCAA CTTTACCGGA AGCACATTTT AGAACTACAG ATGAAATGTT AAACGAGTTT 714 0 

50 CATTTTTTAG GTGAAGAAAA AG CGCATGAA ATTGTTGTGA AAAATACAAA CGAATTAGCA 7200 

GATCGAATTG AACGTGTTGT TCCTATTAAA GATGAATTAT ACACACCGCG TATGGAAGGT 7260 
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CTGCCTCAAA 


TCGTAATTGA 


TCGATTAGAA 


AAAGAATTAA 


AAAGTATTAT 


CGGTAATGGA 


7380 


TTTGCGGTAA 


TTTACTTAAT 


TTCGCAACGT 


TTAGTTAAAA 


AATCATTAGA 


TGATGGATAC 


7440 


TTAGTTGGTT 


CCCGTGGTTC 


AGTAGGTTCT 


AGTTTTGTAG 


CGACAATGAC 


TGAGATTACT 


7500 


GAAGTAAACC 


CGTTACCGCC 


ACACTATATT 


TGTCCGAACT 


GTAAAACGAG 


TGAATTTTTC 


7560 


AATGATGGTT 


CAGTAGGATC 


AGGATTTGAT 


TTACCTGATA 


AGACGTGTGA 


AACTTGTGGA 


7620 


GCGCCACTTA 


TTAAAGAAGG 


ACAAGATATT 


CCGTTTGAAA 


CATTTTTAGG 


ATTTAAGGGA 


7680 


GATAAAGTTC 


CTGATATCGA 


CTTAAACTTT 


AGTGGTGAAT 


ATCAACCGAA 


TGCCCATAAC 


7740 


TACACAAAAG 


TATTATTTGG 


TGAGGATAAA 


GTATTCCGTG 


CAGGTACAAT 


TGGTACTGTT 


7800 


GCTGAAAAGA 


CTGCTTTTGG 


TTATGTTAAA 


GGTTATTTGA 


ATGATCAAGG 


TATCCACAAA 


7860 


AG AGG TGCTG 


AAATAGATCG 


ACTCGTTAAA 


GGATGTACAG 


GTGTTAAACG 


TACAACTGGA 


7920 


CAGCATCCAG 


GGGGTATTAT 


TGTAGTACCT 


GATTACATGG 


ATATTTATGA 


TTTTACGCCG 


7980 


ATACAATATC 


CTGCCGATGA 


TCAAAATTCA 


GCATGGATGA 


CGACACATTT 


TGATTTCCAT 


8040 


TCTATTCATG 


ATAATGTATT 


AAAACTTGAT 


ATACTTGGAC 


ACGATGATCC 


AACAATGATT 


8100 


CGTATGCTTC 


AAGATTTATC 


AGGAATTGAT 


CCAAAAACAA 


TACCTGTAGA . 


TGATAAAGAA 


8160 


GTTATGCAGA 


TATTTAGTAC 


ACCTGAAAGT 


TTGGGTGTTA 


CTGAAGATGA 


AATTTTATGT 


8220 


AAAACAGGTA 


CATTTGGGGT 


ACCAGAATTC 


GGTACAGGAT 


TCGTGCGTCA 


AATGTTAGAA 


8280 


GATACAAAGC 


CAACAACATT 


TTCTGAATTA 


GTTCAAATCT 


CAGGATTATC 


TCATGGTACA 


8340 


GATGTGTGGT 


TAGGCAATGC 


TCAAGAATTA 


ATTAAAACCG 


GTATATGTGA 


TTTATCAAGT 


8400 


GTAATTGGTT 


GTCGTGATGA 


TATCATGGTT 


TATTTAATGT 


ATGCTGGTTT 


AGAACCATCA 


8460 


ATGGCTTTTA 


AAATAATGGA 


GTCAGTACGT 


AAAGGTAAAG 


GTTTAACTGA 


AGAAATGATT 


8520 


GAAAeGATGA 


AAGAAAATGA 


AGTGCCAGAT 


TGGTATTTAG 


ATTCATGTCT 


TAAAATTAAG 


8580 


TACATGTTCC 


CTAAAGCCCA 


TGCAGCAGCA 


TACGTTTTAA 


TGGCAGTACG 


TATCGCATAT 


8640 


TTCAAAGTAC 


ATCATCCACT 


TTATTACTAT 


GCATCTTACT 


TTACAATTCG 


TGCGTCAGAC 


8700 


TTTGATTTAA 


TCACGATGAT 


TAAAGATAAA 


ACAAGCATTC 


GAAATACTGT 


AAAAGACATG 


8760 


TATTCTCGCT 


ATATGGATCT 


AGGTAAAAAA 


GAAAAAGACG 


TATTAACAGT 


CTTGGAAATT 


8820 


ATGAATGAAA 


TGGCGCATCG 


AGGTTATCGA 


ATGCAACCGA 


TTAGTTTAGA 


AAAGAGTCAG 


8880 


GCGTTCGAAT 


TTATCATTGA 


AGGCGATACA 


CTTATTCCGC 


CGTTCATATC 


AGTGCCTGGG 


8940 


CTTGGCGAAA 


ACGTTGCGAA 


ACGAATTGTT 


GAAGCTCGTG 


ACGATGGCCC 


ATTTTTATCA 


9000 


AAAGAAGATT 


TAAACAAAAA 


AGCTGGATTA 


TCTCAGAAAA 


TTATTGAGTA 


TTTAGATGAG 


9060 
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GAAATAATCA AGGTATTTAT TTAATGCGTA TGGCGTAGTC AAAGAAATAC AAAATTGTTG 
CTGGACACAA AATTATGCCC GTATTTCTTT TCAATGTCTT ACGAGTCTAT TCAAATGTAA 
TGGTGAAATA AAGGAACAAA CTTTTACAAG AATCTCTGAT TAATAGTGAA GTCATTTGTT 
TCAAGCATAA ACTTATGCTA TAATTAAGTT GCTTAAAAAT TAGTGAACTC AGGCAGAAGA 
GTGGGAGATT CCCGCTCTTT TCTATTTGCC AAAAAGGGAG GCCTGTATGA GTAAAATTAC 
AGAACAAGTA GAAGTGATTG TTAAACCAAT TATGGAAGAC TTGAATTTTG AACTTGTAGA 
CGTTGAATAT GTCAAAGAGG GTAGAGATCA TTTTCTTAGA ATCTCTATTG ATAAAGAAGG 
TGGCGTAGAT TTAAATGATT GTACGCTAGC TTCTGAAAAA ATAAGTGAAG CTATGGATGC 
AAATGATCCT ATTCCTGAAA TGTATTATTT AGACGTAGCG TCACCTGGTG CAGAACGTCC 
AATTAAAAAA GAACAAGATT TCCAAAATGC AATAACTAAA CCTGTATTTG TTTCTTTATA 
TGTACCAATT GAAGGTGAAA AGGAATGGTT AGGCATTTTA CAAGAAGTCA ATAATGAAAC 
AATTGTAGTA CAAGTTAAAA TCAAAGCAAG AACGAAAGAT ATAGAGATAC CGAGAGACAA 
AATAGCAAAA GCACGTCACG CAGTTATGAT TTAACGTGAT GAGGAGGAAA AAACGTGTCA 
AGTAATGAAT TATTATTAGC TACTGAGTAT TTAGAAAAAG AAAAGAAGAT TCCTAGAGCA 
GTATTAATTG ATGCTATTGA AG CAGCTTTA ATTACTG CAT ACAAAAAGAA TTATGATAGT 
GCAAGAAATG TCCGTGTGGA ATTAAATATG GATCAAGGTA CTTTCAAAGT TATCGCTCGT 
AAAGATGTTG TTGAAGAAGT ATTTGACGAC AGAGATGAAG TGGATTTAAG TACAGCGCTT 
GTTAAAAACC CTGCATATGA AATTGGTGAT ATATACGAAG AAGATGTAAC ACCTAAAGAT 
TTTGGTCGTG TAGGTGCTCA AGCAGCGAAA CAAGCAGTAA TGCAACGTCT TCGTGATGCT 
GAAGGTGAAA TTTTATTTGA AGAATTTATA GACAAAGAAG AAGACATACT TACTGGAATT 
ATTGACCGTG TTGACCATCG TTATGTATAT GTGAATTTAG GTCGTATCGA AGCTGTTTTA 
TCTGAAGCAG AAAGAAGTCC TAACGAAAAA TATATTCCTA ACGAACGTAT CAAAGTATAT 
GTTAAeAAAG-TGGAACAAAC-GACAAAAGGT CCTCAAATCT ATGTTTCTCG-TAGCCATCCA - 
GGTTTATTAA AACGTTTATT TGAACAAGAA GTTCCAGAAA TTTACGATGG TACTGTAATT 
GTTAAATCAG TAGCACGTGA AGCTGGCGAT CGCTCTAAAA TTAGTGTCTT CTCTGAAAAC 
AATGATATAG ATGCTGTTGG TGCATGTGTT GGTGCTAAAG GCGCACGTGT TGAAGCTGTT 
GTTGAAGAGC TAGGTGGTGA AAAAATCGAC ATCGTTCAAT GGAATGAAGA TCCAAAAGTA 
TTTGTAAAAA ATGCTTTAAG CCCTTCTCAA GTTTTAGAAG TTATTGTTGA TGAAACAAAT 
CAATCTACAG TAGTTGTTGT TCCTGATTAT CAATTGTCAT TAGCGATTGG TAAAAGAGGA 
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9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 



55 



BNSDOCID: <EP 0786519A2_I_> 



806 



10 



15 



20 



EP0 786 519 A2 

GATGCGCGTG AAGCGGGTAT CTATCCAGTA GTTGAAGCTG AAAAAGTAAC TGAAGAAGAT 10980 

GTTGCTTTAG AAGATGCTGA CACAACAGAA TCAACCGAAG AGGTAAATGA TGTTTCAGTT 11040 

GAAACAAATG TAGAGAAAGA ATCTGAATAA TAGGTTGGAG TGAAGTATCT ATGAAAAAGA 11100 

AAAAAATTCC GATG CGAAAA TGTATTCTTT CAAATGAAAT GCATCCCAAA AAAGATATGA 11160 

TTCGTGTTGT TGTTAATAAA GAAGGCGAAA TCTTTGCGGA TGTTACTGGA AAGAAACAAG 1122 0 

GCCGTGGCGC ATATGTTTCT AAAGATGTTG CTATGGTTGA AAAAGCACAA CAAAAAGAAA 11280 

TTTTAGAAAA ATATTTTAAA GCATCTAAAG AGCAATTGGA TCCTGTTTAC AAAGAAATTA 11340 

TTAGATTAAT TTATAGAGAA GAGATCCCAA AATGAGTATA GATCAAATAT TAAACTTTTT 114 00 

AGGATT AG CA ATGAGAGCTG GTAAAGTAAA AACAGGTGAA TCAGTCATTG TTAATGAGAT 1146 0 

TAAAAAAGGA AATTTGAAGC TCGTTATTGT TGCAAATGAT GCGTCTGATA ATACAGCTAA 11520 

ATTAATTACA GATAAATGTA AGAGTTACAA AGTTCCATTC AGAAAGTTTG GAAATCGAAA 1158 0 

TGAATTGGGA ATAGCACTTG GAAAAGGTGA GCGTGTTAAT GTAGGGATTA CTGACCCAGG 11640 

CTTTGCTAAA AAGTTGCTAT CAATGATAGA TGAATATCAT AAGGAGTGAT TATATGAGTA 11700 

25 AACAAAGAAT TTACGAATAT GCGAAAGAAT TAAATCTAAA GAGTAAAGAG ATTATAGATG 1176 0 

AGTTAAAAAG CATGAATATT GAGGTTTCAA AT CAT ATGCA AGCTTTGGAA GATGACCAAA 1182 0 

TTAAAGCATT AGATAAAAAG TTCAAAAAAG AACAAAAGAA CGACAATAAA CAAAGCACTC 11880 

30 AAAATAATCA CCAAAAATCA AACAATCAAA ACCAAAATAA AGGGCmACAA AAAGATAACA 11940 

AAAAGAATCm ACAACAAAAT AATAAAGGCA ACAAAGGCAA TAAAAAGAAT AATAGAAATa 12000 

ATAAGAAAAA TAACAAGAAT AATAAACCAC AAAATCAACC AGCTGCTCCA AAAGAAATAC 12060 

CATCAAAAGT GACATATCAA GAAGGTATTA CAGTAGGCGA ATTTGCGGAT AAATTAAATG 12120 

TTGAATCATC AGAAATTATC AAAAAATTAT TCTTACTTGG TATTGTTGCT AATATCAATC 12180 

AATCATTAAA TCAAGAAACA ATCGAATTAA TTGCCGATGA TTATGGCGTT GAGGTTGAAG 12240 

AAGAAGTTGT GATTAATGAA GAAGACTTAT CAATCTATTT CGAAGACGAA AAAGATGATC 12300 

CAGAGGCAAT TGAGAGACCA GCAGTTGTAA CAATTATGGG ACATGTTGAC CATGQTAAAA 12360 

CGACTTTATT AGATTCAATT CGTCATACAA AAGTTACAGC AGGTGAAGCA GGCGGAATCA 12420 

CTCAACATAT TGGTGCATAT CAAATTGAAA ACGATGGCAA AAAAATCACT TTCTTAGATA 12480 

CACCGGGACA TGCTGCATTT ACAACGATGC GTGCGCGTGG TGCa CAAGTA ACAGATATTA 12540 

CTATTTTAGT AGTAGCAGCT GACGATGGTG TTATGCCACA AACAATTGAA GCAATTAACC 12600 

ATGCTAAAGA AGCAgAAGTA CCAATTATTG TTGCAGTAAA TAAAATTGAT AAACCAACTT 12660 
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GCGGCGAAAC AATTtTCGTc 


CACTTT C " 1 


ATTAAGTGGT 


GATGGTATCG 


ACGATTTATT 


12780 




AGAAATGATA GGATTAGTTG 


CAGAAGTTCA 


AGAACTTAAA 


GCAAATCCTA AAAACCGTGC 


12840 


5 


TGTTGGTACA GTTATCGAAG 


CTGAATTAGA 


TAAATCACGT 


GGTCCTTCTG 


CATCATTATT 


12900 




AGTACAAAAC GGTACATTAA 


ATGTTGGTGA 


TGCGATTGTA 


GTTGGTAATA 


CTTACGGCCG 


12960 


10 


TATCCGTGCA ATGGTTAATG 


ACTTAGGTCA 


AAGAATCAAA 


ACGGCTGGTC 


CATCAACGCC 


13020 


TGTTGAAATT ACAGGTATTA 


ATGATGTGCC 


ACAAGPTGGG 


GATCGCTTTG 


TTGTATTTAG 


13080 




TGATGAAAAA CAAGCTCGTC 


GTATTGGTGA 


ATC!AAGAC , Af* 


GAAGCTAGCA 


TTATACAACA 


13140 


IS 


ACGTCAAGAA AGTAAAAATG 


TTTCATTAGA 


X XWV. ClUX X X 


GAACAAATGA 


AACAAGGTGA 


13200 




AATGAAAGAT TTAAACGTTA 


TTATTAAAGG 


TGATGTTf* A A 

X VJfliU X X LJVi 


GGTTCTGTTG 


AAGCTTTAGC 


13260 




TGCATCATTA ATGAAAATTG 


ATGTTGAAGG 


OGT A A A TGTT 
\— VJ X nnn X V> X X 


CGTATCATTC 


ATACAGCGGT 


13320 


20 


TGGTGCAATT AATGAGTCAG 


ACGTGACACT 




TCAAATGGTA 


TTAT CATTGG 


13380 




TTTCAATGTT CGTCCAGACA 


GTGGTGCAAA 


ACGTGPTGPA 


GAAGCTGAAA 


ATGTTGATAT 


13440 




GCGTTTACAC AGAGTTATTT 


ATAATGTTAT 


ca a ag & a utt 


GAATCAGCGA 


TGAAAGGTTT 


13500 


25 


ACTTGATCCA GAATTTGAAG 


AACAAGTTAT 


Luuinuwuc x 


GAAGTTCGTC 


AAACATTCAA 


13560 




AGTTTCTAAA GTTGGTACTA 


TTGCTGGATG 


T**T* ATY1TT & (T 
x iniux inv*i 


GAAGGTAAAA 


TTACGCGAAA 


13620 




TGCTGGTGTA CGTATTATTC 


GTGATGGTAT 


TCTTr A ATZi T 
Xwx X ± t\ i. 


GAAGGCGAAT 


TAGATACACT 


13680 


30 


TAAACGTTTC AAAGATGATG 


CTAAGGAAGT 


TGP A A A AGGT 


TATGAATGTG 


GTATTACAAy 


13740 




TGAAAACTAC AATGACCTTA 


AAGAAGGCGA 


TRTT A TPG a 21 


GCATTTGAAA 


TGGTTGAAAT 


13800* 


35 


TAAGCG TTAA TTAAATAAAT 


TACAAGCTAA 


AAGTATAGTT 

4m**\J X *^ X X X 


AAGATTGATA 


TGCTCCCTAT 


13860 


AAATATTGCA CTTTTTAAGT 


GTCTACTTTA 


TAGGGAGCAT 


ATTTGATACT 


AGCTTTTGGT 


13920 




TTTTTATTAG AATAGATTAC 


CTATTAAAAG 


TTACGTTATA 


TGGACATGAT 


TTTGTATAAA 


13980 


40 


ATTTTGTGGT GGCCTAGAAT 


GATTTTTAAT 


GACAAAATAT 


AATGTCGACT 


ATTATTGGAA 


14040 




AATTTTCTGT— TGaAATGGGT -ATCTTACGGC -AAACTTTATT~TGATTTTATA~ 


GG CTTAATTT 


1~4~1~0~0™ 




ATTAAAATAA CGTGTG AG CT 


AAAATAATTG 


TTTAAGCATT 


GTTACACTAA 


AAAATGCAAA 


14160 


45 


TAACAATTGA ACTTAAAGAT 


AAAGAGGTGA 


CAAGAATGAG 


CAGTATGAGA 


GCAGAGCGTG 


14220 




TTGGTGAACA AATGAAGAAG 


GAATTAATGG 


ATATCATCAA 


CAATAAAGTC 


AAAGATCCTC 


14280 




GAGTTGGTTT TATTACAATT ACAGATGTTG 


TTTTAACAAA 


TGATTTATCG 


CAGGCTAAAG 


14340 


SO 


TATTTTTAAC TGTATTAGGT 


AACGATAAAG 


AAGTAGAAAA 


TACATTTAAA 


GCACTTGATA 


14400 




AAGCAAAAGG CTTCATTAAG 


TCTGAATTAG 


GTTCTAGAAT 


GCGATTACGT 


ATTATGCCGG 


14460 
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AAGATTTACA CAAACAAGAT AGATAATTTA GTGTTAGCTA TCTGGAAAAT GTTTGATAAT 14 580 

TTCTTAATAT CGGTATATTA ACATTAAACA GTTAATACAT AGATG TGTAG AAATAGTTAA 14640 

CATTTTCCAG TTTTTTTATG AATAAATTTA GTTGATACGC TATTAAAATA TATTTTAAAA 14700 

AAGAAGGTGA CTATATGTAT AATGGGATAT TACCAGTATA TAAAGAGCGC GGTTTAACAA 14 760 

GTCATGACGT TGTATTCAAA TTGCGTAAAA TATTAAAAAC TAAAAAAATA GGTCACACGG 14 82 0 

GTACG CTTGA TCCCGAAGTT GCAGGCGTGT TACCGGTATG TATAGGTAAT G CAACGAG AG 14 880 

TTAGTGATTA TGTTATGGAT ATGGGCAAAG CTTATGAAGC AACTGTATCG ATAGGAAGAA 14 940 

GTACAACGAC TGAAGATCAA ACGGGTGATA CATTGGAAAC AAAAGGTGTA CACTCAGCAG 15000 

ATTTTAATAA GGACGATATT GACCGATTGT TAGAAAGTTT TAAAGGTATC ATTGAACAAA 1506 0 

TTCCGCCGAT GTACTCATCC GTCAAAGTAA ATGGTAAAAA ATTATATGAA TATGCGCGTA 1512 0 

ATAATGAAAC AGTTGAAAGA CCAAAGCGTA AAGTtAATAT TAAAGACATT GGGCGTATAT 15180 

CTGAATTAGA TTTTAAAGAA AATGAGTGTC ATTTTAAAAT ACGCGTCATC TGTGGTAAAG 15240 

GTACATATAT TAGAACGCTA GCAACTGATA TTGGTGTGAA ATTAGGCTTT CCGGCACATA 153 00 

TGTCGAAATT AACACGAATC GAGTCTGGTG GATTTGTGTT GAAAGATAOC CTTACATTAG 15360 

AACAAATAAA AGAACTTCAT GAGCAGGATT CATTGCAAAA TAAATTGTTT CCTTTAGAAT 15420 

ATGGATTAAA GGGTTTGCCA AGCATTAAAA TTAAAGATTC GCACATAAAA AAACGTATTT 15480 

TAAATGGGCA GAAATTTAAT AAAAATGAAT TTGATAACAA AATTAAAGAC CAAATTGTAT 15540 

TTATTGATGA TGATTCAGAA AAAGTATTAG CAATTTATAT GGTACACCCT ACAAAAGAAT 156 0 0 

CAGAAATTAA ACCTAAAAAA GTCTTTAATT AAAGGAGATA GAATTTATGA AAGTCATAGA 15660 

AGCGACACAT CCTATACAAT CTAAACAGTA TATTACAGAG GATGTTGCAA TGGCATTCGG 1572 0 

ATTTTTCGAT GGCATGCATA AAGGTCATGA CAAAGTCTTT GATATATTAA ACGAAATAGC 15780 

TGAGGCACGC AGTTTAAAAA AAGCGGTGAT GACATTTGAT CCGCATCCGT CTGTCGTGTT 1584 0 

GAATCCTAAA AGAAAACGAA CAACGTATTT AACGCCACTT TCAGATAAAA TCGAAAAAAT 15900 

TAGCCAACAT GATATTGATT ATTGTATAGT GGTTAATTTT TCATCTAGGT TTGCTAATGT 15960 

GAGCGTAGAA GATTTTGTTG AAAATTATAT AATTAAAAAT AATGTAAAAG AAGTCATTGC 16020 

TGGTTTTGAT TTTACTTTTG GTAAATTTGG AAAAGGTAAT ATGACTGTAC TTCAAGAATA 16080 

TGATGCGTTT AATACGACAA TTGTGAGTAA ACAAGAAATT GAAAATGAAA AAATTTCTAC 1614 0 

AACTTCTATT CGTCAAGATT TAATCAATGG TGAGTTGCAA AAAGCGAATG ATGCTTTAGG 16200 

CTATATATAT TCTATTAAAG kCACTGTAGT GCAAGGTGAA AAAAGGGGAA GAACTATTGG 16260 
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TGCTGTTAGT 
TGTAAAGCCA 
TGACTTTGAG 
TCCTGAGATT 
GCGTGCTAAA 
TTGCGTATAG 
ACGCCTAACT 
TTCACAAGAA 
TTCACCAGAA 
ACGTACACAC 
TAGcATTTaT 
TCACTTGGTA 
TCCAACCTTA 
GCTAATATTG 
GTAATAATCA 
ACTGATAAGG 
TTTTTTCCAA 
AACTATTAGA 
GAATGGGCAG 
GCTGTATTGG 
CCTCGTGATG 
GGTAAAATTC 
ACTGCGCGAT 
GTTCAAATTA 
ATGATTGGTT 
GGTGTAAATG 
GAAGTTTCTC 
GCAGGCGCTA 
GAGATTCAAC 



ATTGAAATCG 
ACATTTCATG 
GATAATATTT 
AAATTTGATG 
TATTTATTAG 
tTATATAAAC 
CGGATTAAGG 
CGTAAAAACG 
GTACAAATCG 
AAAAAAGACC 
TAAACTACTT 
TCCGTCGTTA 
ATTTATATTA 
AGTGAATAAT 
AGATATTAAA 
GTGGGACGAT 
TTCAATATTT 
TTCAAGAGAG 
GAAGATCTTT 
TTCGTTATGG 
GAGATTTCTT 
CTGGTGGATT 
TAATTGATAG 
TGAACATGGT 
CATCTATGGC 
TGGGTTATAT 
GTTTAGACCT 
GTGAGATTAC 
GTTTAGTTGA 



GCACTGAAAA 
ATCCTAACAA 
ATGGTGAACG 
GTATCGACCC 
CAGTTGATTT 
AATCTATACC 
AGTATTCAAA 
AAATCATTAA 
CTGTACTTAC 
ACCATTCACG 
ACGTaGTAAA 
ATCTTAATAT 
AAAAAGCTTT 
AAGGTTACAA 
AATAAAGTAT 
AAGTCTATTT 
TATAACTAAT 
GAGATTTATA 
AACGATTGAA 
AGATACAGTC 
CCCATTAACA 
TAAAAAGAGA 
ACCAATTAGA 
ATTAAGTGCA 
GCTTAGTGTG 
TGACGGTAAA 
TGAAGTAGCT 
TGAACAAGAA 
TTTCCAACAA 



TAAATTATAT 
AGCAGAAGTT 
AGTGACCGTG 
ATTAGTTAAA 
TGGTGATGAA 
ACACCTTTTT 
CATTTTAAGG 
AGAATACCGT 
TGCAGAAATC 
TCGTGGATTA 
GATATTCAAC 
AACGTCTTTG 
TTACAAATAT 
TGAGATAAAG 
GTTTTTTTAA 
TGTAAATAAT 
ATTAAAATAC 
ATGTCTCAAG 
ACAGGGCAAT 
GTGTTATCGA 
GTGAACTATG 
GAAGGACGTC 
"CCTTTATTCC 
GATCCTGATT 
TCGGATATTC 
TATATCATTA 
GGTCATAAAG 
ATGTTAGAGG 
CAAATCGTCG 



CGAGGGGTAG 
GTCATCGAAG 
AATTGG CAT C 
CAAATGAACG 
GTAGCTTATA 
CTTAGTAGGT 
AGGAAATTGA 
GTACACGAAA 
AACGCaGTAA 
TTAAAAATGG 
GTTACCGTGA 
AGGTTGGGGC 
TAACATTTAT 
ATGATATAAG 
AAAATATAAC 
AGATGGATAT 
GATAATAAAT 
AAAAGAAAGT 
TAGCTAAACA 
CGGCAACTGC 
AAGAAAAAAT 
CTGGTGACGA 
CTAAAGG ATA 
GTTCACCACA 
CATTCCAAGG 
ACCCAACAGT 
ATGCGGTAAA 
CGATTTTCTT 
AC CACATTCA 



CTAACATAGG 

TGAATATCTT 

ATTTCTTACG 

ATGATAAATC 

ATATCTAGAG 

CGAATCTCCA 

TTATGGCAAT 

CTGATACTGG 

ACGAACACTT 

TAGGTCGTCG 

ATTAATTAAA 

ATATTTATGT 

TATATGTTAA 

TACACCTAGA 

TTATATTTAT 

CCCGCTCTCT 

GATATGATAT 

TTTTAAAACT 

AGCAAATGGC 

ATCAAAAGAA 

GTACGCTGCG 

TGCAACATTA 

TAAGCATGAT" 

AATGGCTGCA 

GCCAATCGCC 

AGAAGAAAAA 

CATGGTAGAG 

TGGTCATGAA 

ACCTGTTAAA 



16380 
16440 
16500 
16560 
16620 
16680 
16740 
16800 
16860 
16920 
16980 
17040 
17100 
17160 
17220 
17280 
17340 
17400 
17460 
17520 
17580 
17640 
"17700 
17760 
17820 
17880 
17940 
18000 
18060 
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GAAGAAAAAG GACTTAAAGA AACAGTTTTA ACATTTGATA AACAACAACG AGATGaAAAT 18180 

CTTGATAACT TAAAAGAAGA AATCGTCAAT GAATTTATCG ATGAAGAAGA TCCAGAGAAT 18240 

GAaTTACTTA TTAAAGAAGT TTATGCAATT TTAAATGAAT TAGTGAAAGA AGAAGTTCGA 18300 

CGTTTAATTG CAGATGAAAA AATTAG AC CA GACGGCCGTA AACCTGATGA AATCCGTCCA 18360 

TTAGATTCTG AAGTTGGTAT TTTACCTAGA ACGCATGGTT CAGGTCTATT TACACGTGGT 18420 

CAGACTCAAG CACTTTCAGT TTTAACATTA GGTG CTTTAG GCGATTATCA ATTAATTGAT 18480 

GGTTTAGGAC CTGAAGAAGA AAAAAGATTC ATGCATCATT ACAACTTCCC GAATTTTTCA 18540 

GTAGGTGAAA CTGGTCCAGT ACGTGCGCCA GGTCGTCGTG AAATTGGACA TGGTGCGTTA 18600 

GGTGAAAGAG CATTAAAATA TATTATTCCT GATACTGCTG ATTTCCCATA TACAATTCGT 18660 

ATTGTAAGTG AGGTACTTGA ATCAAATGGT TCATCATCTC AAG CGTCAAT TTGTGGATCA 18720 

ACATTAG CAT TAATGGATGC GGGCGTACCG ATTAAAGCAC CAGTTGCTGG TATTGCTATG 18780 

GGCCTTGTTA CACGTGAAGA TAGCTATACG ATTTTAACTG ATATCCAAGG TATGGAAGAT 18840 

GCATTAGGTG ATATGGACTT TAAAGTCGCT GGTACTAAAG AAGGTATTAC AGCAATCCAA 18900 

ATGGATATTA AAATTGACGG TTTAACGCGT GAAATTATCG AAGAGGCTCT AGAACAAGCG 18960 

AGACGTGGTC GTTTAGAAAT AATGAATCAT ATGTTACAAA CAATTGATCA ACCACGTACT 19020 

GAATTAAGTG cTTACGCGCC AAAAGTTGTA ACTATGACAA TTAAACCAGA TAAGATTAGA 19080 

GATGTTATCG GACCTGGTGG TAAAAAAATT AACGAAATTA TTGATGAAAC AGGTGTTAAA 19140 

TTAGATATTG AACAAGATGG TACTATCTTT ATTGGTGCTG TTGATCAAGC TATGATAAAT 19200 

CGTGCTCGTG AAATCATTGA GGAAATTACA CGTGAAGCGG AAGTAGGTCA AACTTATCAA 19260 

GCCACTGTTA AACGTATTGA AAAATACGGT G CGTTTGT AG GCCTATTCCC AGGTAAAGAT 19320 

GCGTTGCTTC ACATTTCACA AATTTCAAAA AATAGAATTG AAAAAGTGGA AGATGTATTA 19380 

AAAATCGGTG ACACAATTGA AGTTAAGATT ACTGAAATTG ATAAACAAGG TCGAGTAAAT 19440 

GCTTCACATA GAGCATTAGA AGAATAATAT TTAAAGTCAT ATGACGACAA TGTATCGTCA 19500 

TGTGATTTTT TTATGCCACT TTTTACGAAG TGACCCGTTT TGAATTTGTT GTATTGAACA 19560 

TTTTAAAACG CTTTATTATT TTGTGTGCAA CTGTTAATTA TCCTGTATGT ATAGTGATTA 19620 

ATAGTGTACA TCAAGTGTTT TTTAACTTAT AATGAATAGT GAGTTTATAT ATGGACGGGT 19680 

AACAAATTTA GGAGGTAAGA TTTTGAGTTT AATAAAGAAA AAGAATAAAG ATATTCGCAT 19740 

TATACCATTA GGCGGTGTTG GCGAAATTGC TAAAAATATG TATATCGTTG AAGTAGACGA 19800 

TGAAATGTTT ATGTTAGATG CTGGACTTAT GTTTCCAGAA GACGAAATGC TAGGTATTGA 19860 
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CCTTACACAC 
TG CACCAGT A 
TAATATTGAT 
AAACGTGAAT 
TATTCACACT 
ACATGGACAT 
TGTCTTAATC 
GATTGAACAT 
TTATGCTTCG 
TAAAGTGTCA 
GTATTTCGAC 
AAATGAAGTG 
AATGGCGCAA 
AATTACGGCT 
GnCTGGCGCA 
GGAAGAATTA 
TGAATTTAAA 
AAAGATTTTC 
AAATGAAAAG 
AAATATCGTG 
AACGTTAGAT 
-TGTATATGTA 
AGTAGAGGCT 
TGATCAAATT 
AATTTCTGAA 
ATATAATGGT 
GATTAATCTG 
CGTCTGTTTG 
TTAACTAAGG 



GGACATGAGC 
TATGGATCTA 
AAAAAAGTTC 
ATTAGTTTCT 
TCATATGGTG 
TATGCACCAG 
AGTGATTCTA 
CATATGTATG 
AACTTTATAC 
TTTTTAGGAA 
ATTCCTAAAG 
ATAATTATAG 
CATAAGCATA 
TCTGCTAATA 
CATATTATTC 
AAAATGATGA 
ATGCAGATAG 
CTTGTGGAAA 
GTAAATTCAG 
TTGAGAGACC 
CCTAAAAATA 
GGTGAAAGTG 
GGTTTACAAG 
AGTAAACTAT 
ATTTAATCAA 
TGTCATGGAC 
TTATCTTAAG 
GACTACATAT 
CAACATAAGG 



ACGCGATTGG 
AATTGACAAT 
GCTACTATAC 
TTAATACGAC 
CCATTGTGTA 
ATATTAAACG 
CTGAGGCAGA 
ATGCTTTTGC 
GTATTCAGCA 
GATCACTTGA 
ATTTGCTAAT 
CTACTGGTAT 
AAATTATGAA 
TGGAAGTTAT 
CAAATAACAA 
TTAATATTAT 
CACATGCGAA 
AAGGAGATGT 
GAAATATTTT 
GTCATCTTTT 
GACGTATAGC 
AAGACTTATT 
AAAAACGCAT 
TATTCGAAAG 
AAAGTCATTA 
AATTTACTTA 
TAAATTGATA 
TCTAAACATC 
AGGTGCGTCA 



TGCAGTGAGT TATGTTTTAG AACAATTAGA 19980 
AGCGTTAATT AAAGAAAATA TGAAAGCCCG 20040 
AGTTAATAAT GATTCAATTA TGAGATTCAA 20100 
ACACAGTATT CCTGATAGTT TAGGTGTTTG 20160 

TACAGGTGAA TTTAAGTTTG ACCAAAGTTT 20220 

TATGGCAGAG ATTGGTGAAG AAGGCGTATT 202 80 

GAAACCTGGA TATAATACTC CGGAAAATGT 2 0 340 

AAAAGTGCGA GGTCGCTTGA TAGTTTCATG 20400 

AGTTTTAAAT ATTGCTAGCA AGCTAAATCG 20460 

AAGTTCATTT AATATTGCTC GTAAAATGGG 2 0520 

TCCTATAACA GAAGTTGATA ATTATCCTAA 2 0580 

GCAAGGAGAA CCTGTAGAAG CCTTAAGTCA 20640 

TATCGAAGAA GGCGATT CTG TATTTTTAGC 2 0700 

CATTGCGAAT AcATTAAATG AGCtTgTtAC 20760 

AAAGATTCAT GCTTCAAGTC ATGGTTGCAT 20820 

GAAACCTGAA TACTTTATTC CTGTACAAGG 20880 

GCTAGCAGCT GAAGCAGGTG TTG CACCAGA 20940 

CATTAATTAC AACGGTAAAG ATATGATATT 21000 

AATAGATGGC ATTGGTATTG GGGATGTAGG 21060 

AGCAGAAGAT GGTATCTTTA TTGCTGTTGT 21120 

TGCGGGACCT GAAATTCAAT CTCGTGGGTT 21180 

ACGTGAAGCA GAAGAGAAAG TACGTGAAAT 2124 0" 

AGAATGGTCT GAAATTAAAC AAAATATGCG 21300 

TACAAAACGT CGTCCTATGA TTATTCCAGT 21360 

ACATAAAAGA GGTCAGAACA AGTCACTGAA 214 20 

TATTTTATGA TAGTCAATTG AAGGGGTAAC 214 80 

CATAGATGAT ATTGTTCTAA CCTCTTTCAT 21540 

AAATAGGAAA TTATATATAA TAACGTCGTT 21600 

ATTGGCACAA GCAAAAAAGA AATCGACAGC 21660 
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GATACGTTAT GTCATAGCTA TTTTAGTAGT TGTATTAATG GTGTTGGGTG TTTTCCAATT 21780 

AGGAATAATA GGTCGTCTAA TTGACAGCTT CTTTAATTAT TTATTTGGGT ACAGTAGATA 21840 

TTTAACATAT ATTTTAGTAC TCTTAGCAAC TGGTTTTATT ACATACTCTA AACGTATTCC 21900 

TAmaACTAGA CGAACGGCTG GTTCGATTGT ATTGCAAATT GCATTGCTAT TTGTATCACA 21960 

GTTAGTTTTT CATTTTAATA GTGGTATCAA AGCTGAAAGA GAAC CTGTAC TTTCTTATGT 22020 

GTATCAGTCA TACCAACACA GTCATTTCCC AAATTTTGGT GGCGGTGTAT TAGGCTTTTA 2 2080 

TTTATTAGAG TTAAGCGTAC CTTTAATTTC ATTATTTGGT GTATGTATTA TTACTATTTT 22140 

ATT ATTATG C TCAAGTGTTA TTTTATTAAC AAACCATCAA CATCGTGAAG TTGCAAAAGT 22200 

TGCACTGGAA AATATAAAAG CTTGGTTTGG TTCATTTAAT GAA 22243 
(2) INFORMATION FOR SEQ ID NO: 16S: 

20 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5510 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 165: 

TTATTAATnA TTAATATTTT TATTTTTAAA AATAAAGCGA GGAGCTATCA ATGGAACAAA 60 

30 

TTACTTCTGC ACAAAATAAT AGAATTAAAC AAGCGAACAA GCTAAAAmAG AAACGTGAGA 120 

GGGATAAAAC TGGATTAGCT TTAATTGAAG GTGTGCATTT AATTGAAGAA GCTTATCAAA 180 

35 GTGGAATTGT AATTACACAA TTATTTGCAA TTGAACCGGC AAGATTAGAT CAGCAAATTA 24 0 

wCGCATACGC GCAAGAAGTT TTTgAAATAA ACATGAAAGT TGCTGAATCT TTATCAGGTA 300 

CAGTSACACC ACAAGGGTTT TTCGCAATCA TTGAGAAGCC GCATTATGAT ATTTCTAAAG 3 60 

40 CACAACAAGT ATTG CTCATC GATCGTGTTC AAGATCCTGG AAATTTAGGC ACATTAATTA 420 

GAACTGCGGA TGCTGCTGGA ATGGATG CTG TAATAATGGA GAAGGGTACG ACAGATCCTT 4 80 

ATCAAGATAA AGTGTTGCGA GCGAGTCAAG GTAGTGTTTT CCATTTGCCA GTTATGACAC 54 0 

AAGATCTCGA TACGTTTATT ACTCAATTTA ATGGTCCTGT TTATGGTACA GCACTTGAAA 600 

ACGCAGTGgC ATACAAAGAA GTTACTTCAA GTGATTCTTT TGCATTACTA TTAGGFTAATG 660 

AGGGAGAAGG TGTTAATCCT GAATTATTAG CACATACTAC ACAAAATTTA ATCATACCTA 72 0 

TTTATGGTAA AGCTGAAAGT TTAAATGTAG CGATTGCAGG TAGTATTTTA CTTTATCATT 7 80 

TGAAAGGTTG ACCGTGTTGA AAGTTTTCCG ATATAATTAT AATTAATTGT TTAACAGAAC 94 0 
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ATAAATAATT GTTTTAGGGA GAATAATCGT GACTGCAAGT TATTCCAATT ATTTAAAGTC * 
TTTTCACCTT TTTGGTTACT TAAAGAGATT TAAGTCGGAA AGACAATCCG TTATCAATAT 
TAAACAAGTG TATGCTTAGG CATAAATTTG GGTGGTACCA CGG AAATGAC TTTCGTCCCT 
TATTTTTTAA GAGGATGAAA GTCTTTTTTT AGTTAAACAA CAAATATGAT AAATAGAAAA 
TGAATAGTTC GAATAGGGAG GTCAGTGACA TATGTCTGAA CAACAAACAA TGTCAGAGTT 
AAAACAACAA GCGCTTGTAG ATATTAATGA AGCAAATGAT GAACGTGCAC TGCAAGAAGT 
TAAAGTGAAA TACTTAGGTA AAAAAGGGTC AGTTAGCGGA CTAATGAAAT TGATGAAGGA 1320 
75 TTTGCCGAAT GAAGATAAAC CTGCGTTTGG TCAAAAAGTG AATGAATTGC GTCAAACAAT 13 80 

TCAAAATGAA TTAGATGAAA GACAACAGAT GTTAGTTAAA GAAAAATTAA ATAAGCcAAT 
TGGcTGAAGA AACAATTGAT GTATCATTAC CAGGTCGTCA TATTGAAATC GGTTCAAAGC 
20 ATCCATTAAC ACGTACAATA GAAGAAATTG AAGACTTATT CTTAGGTTTA GGTTATGAAA 

TTGTGAATGG ATATGAAGTT GAACAAGATC ATTATAACTT CGAAATGCTG AATTTACCTA 
AATCACACCC TGCACGTGAT ATGCAAGATA GTTTCTATAT TACGGATGAA ATTTTATTAC 
GTACGCATAC ATCACCAGTG CAGGCACGTa CGATGGAATC ACGTCATGGT CAAGGTCCAG 
TTAAAATTAT TTGCC CTGGT AAAGTGTATC GTCGTGACTC TGATGATGCG ACACATAGTC 
ATCAATTTAC ACAAATCGAA GGATTAGTTG TTGATAAAAA CGTTAAAATG AGTGATTTGA 186 0 

AAGGTACTTT AGAATTGTTA GCTAAGAAAT TATTTGGTGC TGATCGTGAA ATTCGTTTAC 1920 
GTCCAAGTTA CTTCCCATTC ACTGAAC CTT CTGTAGAAGT TGATGTGTCA TGTTTTAAAT 1980 
35 GTAAAGGAAA AGGTTGTAAT GTGTGTAAAC ACACAGGATG GATTGAAATT TTAGGTGCTG 2040 

GAATGGTACA TCCTAATGTA TTAGAAATGG CTGGTTTTGA TTCTTCAGAG TACTCTGGAT 2100 
TTGCATTTGG TATGGGACCA GACCGTATTG CAATGTTGAA ATATGGTATA GAAGATATTC 2160 

40 GTCAT TTC TA TACTAATGAT GTGAGATTTT TAGATCj^ATT ^AAA^CJ[K3TA._GAAGATAGAG 2220 

GTGACATGTA ATGTTGATAT CAAATGAATG GTTGAAAGAA TATGTAACAA TCGATGATTC 2280 
TGTAAGTAAT TTGGCAGAAC GTATTACGCG CACAGGTATT GAAGTGGATG ATTTAATTGA 2340 
CTACACAAAA GATATCAAAA ATTTAGTTGT CGGCTTCGTT AAGTCAAAAG AGAAACATCC 2400 
TGATGCTGAT AAATTAAATG TTTGCCAAGT TGATATCGGA GAAGACGAAC CTGTACAAAT 2460 
CGTTTGTGGT GCACCGAACG TTGaTGCAGG ACAATATGTC ATTGTTGCTA AAGTAGGTGG 2520 
CAGATTGCCT GGTGGTATTA AAATTAAGCG TGCCAAATTA CGCGGTGAAC GTTCAGAAGG 258 0 

TATGATTTGT TCGTTACAAG AAATTGGTAT TTCAAGTAAC TATATACCGA AAAGTTTTGA 264 0 
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ATATTTAGAT GATCAAGTAA TGGAATTTGA TTTAACGCCG AATCGTGCAG ATGCTTTAAG 2760 

TATGATAGGT ACTGCTTATG AAGTTGCAGC ATTATATAAT ACAAAAATGA CTAAG CCAGA 2820 

GACAACATCA AATGAGCTTG ATTTATCTGC AAATGATGAA CTGACTGTGA CAATTGAAAA 2880 

TGAAGATAAA GTACCATATT ATAGTGCACG TGTTGTTCAC GACGTGACAA TTGAACCCTC 2 94 0 

GCCAATTTGG ATGCAAGCAC GCTTAATAAA AGCGGGTATA CGTCCTATTA ATAATGTTGT 3 00 0 

TGACATTTCA AATTATGTGT TATTAGAATA CGGTCAACCA TTGCACATGT TTGATCAAGA 3 060 

TGCGATTGGT TCACAACAAA TTGTTGTTCG TCAAGCTAAT GAAGGCGAAA AAATGACAAC 312 0 

ATTAGATGAT ACAGAACGTG AATTATTAAC GAGCGATATT GTCATTACTA ATGGACAAAC 3180 

TCCAATTGCA TTAGCTGGTG TTATGGGTGG CGATTTTTCA GAAGTTAAAG AACAAACATC 324 0 

AAATATAGTG ATTGAAGGTG CTATTTTTGA TCCAGTTTCA ATTCGTCATA CATCAAGACG 33 00 

20 TTTAAATTTA CGCAGTGAAT CATCTAGTCG TTTTGAAAAA GGAAT AG CT A CTGAATTTGT 3360 

AGATGAAGCA GTCGACCGTG CATGTTATTT ATTACAAACT TATGCAAACG GAAAAGTGCT 3420 

AAAAGATAGA GTGTCTTCAG GAGAACTTGG TGCATTTATT ACACCAATCG ACATCACTGC 3480 

TGATAAAATT AATCGCACTA TTGGATTTGA TTTGTCACAA AATGATATTG TTACTATTTT 3540 

TAATCAACTA GGGTTTGATA CAGAAATAAA TGATGATGTT ATTACAGTGC TAGTACCATC 3600 

ACGTCGTAAA GATATTACAA TTAAAGAAGA TTTAATTGAA GAAGTTGCAC GTATATATGG 3 660 

ATACGACGAT ATTCCATCAA CGTTACCTGT CTTCGATAAA GTTACTAGTG GTCAGCTAAC 3720 

TGATCGCCAA TATAAAACTA GAATGGTTAA AGAAGTGTTA GAAGGTGCTG GATTAGACCa 37 80 

AGCTATTACG TATTCGTTAG TTTCTAAAGA AGATG CTACT GCaTTTTCGA TGCAACAGCG 3 84 0 

TCAAACAATT GATTTATTGA TGCCAATGAG TGAAGCGCAT GCGTCATTAC GTCAAAGTTT 3 900 

ATT-fiC CACAT TTAATCGAAG CGGCATCATA TAATGTGGCA CGCAAAAATA AAGATGTAAA 3960 

40 ATTATTTGAA ATCGGCAATG TCTTCTTTGC TAATGGAGAA GGTGAACTAC CAGATCAAGT 4 020 

TGAATATTTA AGTGGTATTT TAACTGGAGA TTATGTAGTC AATCAATGGC AAGGTAAGAA 4 080 

AGAAACGGTT GATTTCTATT TAGCAAAAGG TGTCGTGGAT CGAGTATCTG AAAAGTTAAA 414 0 

TCTTGAATTT AGTTATCGCC GTGCTGATAT TGaTGGATTA CATCCAGGTC GTACTGCTGA 4 200 

AATCTTATTA GAGAATAAAG TTGTTGGTTT TATTGGTGAA TTACATCCAA TATTAGCAGC 4 260 

TGATAATGAT TTAAAACGTA CGTATGTTTT TGAGTTGAAT TTTGATGCAT TAATGGCTGT 4 320 

GTCGGTAGGT TACATTAATT ACCAGCCAAT TCCGAGATTC CCAGGCATGT CTCGTGACAT 4 3 80 

TGCATTAGAA GTAGATCAAA ATATTCCAGC AGCTGATTTA TTATCAACGA TTCATGCACA 4 44 0 
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AAAAGGTAAA AAATCAATTG CAATACGTTT AAATTATTTA GACACAGAAG AAACATTGAC 
AGATGAGCGC GTTTCAAAAG TACAAG CGGA AATTGAAGCA GCATTAATTG AACAAGGTGC 
TGTTATTAGA TAATGATTTA AACCCCATGT ATAAGGATAT CTGAAGTAGA TTGATATCCC 
TAACATGGGG TTTTATTTTT GGGTTCACCA ATTTGGTTCC AATGCATTTA AAAAGTCAAA 
GAGGAACAGC GGAATACAGA TGATGc TTCG CACAACTGCA TAAAAGCCTC TAATGATTAA 
AAATCAAAGA GGCTTTAAAA TTTTTTGGGC TTTTTCACGA TTTTTAAAAT GCTTTTTTGA 
AATGGTATCT AAACGTGAAA GACCGTATTT TTTTATAATT TTGGCGGCGA TTACATCGAC 
TTTAGCACCG GCACCTTTAG G AATCGT CAT ATTAATATTT TTTGATATTT GATCCATATA 
TGTAACAAAT GCGTATCGAG AAATTATGCT TGCCACTGCA ATGGCTAATG ACTTCGATTC 
TCCTTTTGTT TCAAATTTTG TTTTCTTTGG AAGTGGTATA TCTGATAATG CGTAATGGCT 
ATACACTTCG CGTTTTGCGA ACTGATCAAT GACGATATAG TCTAATTGAG ACGAATCAAT 
TTTTTCAAGT ACATTTTTGA TGGCTTCATT ATGAAGGGCA GCTTTCATTT TTACTTGAGT 
CCAGCCTTTT GCTTGCTGAA TATTATATTT TTCATTGTGT AGTGTTAATA ATGAATGTGG 
TATGAAAGTA ACCAATTGCT CAGCAAGTTC TACAATTTTG GTATCGGTTA ATTTTTTTGA 
ATCATCTACA CCCAAAGTTT TTAAAATAGG GACATGCTCT TTGGTAACGA AAGCAGCACA 
CACAGTCAAC GGACCAAAGT AATCGCCACT TCCAGCCTCA TCACTACCAA TACAGTTAAA 
TTG r TCATAC ATTAaAGTTg TcCAgAAAAG AATTAGCCAT ATTTnCCTTT 
(2} INFORMATION FOR SEQ ID NO: 166: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9623 base pairs 

(B) TYPE t nucleic acid 

(C) STRANDEDNESS : double 
C (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 166: 
GnTTATACTT ATAAAT TTTA CGGGGGTAAT ATAATACTtA TTTACCTGTA ATATATGATA 
ATTCTTCAGC GGCAGCTGCG TTG AT AGTT C TATGAGAAAT GATACCTAAT CCTTTAACAT 
TGGATTCTGA AATAACGATA GAACCATCAC TGTTAACTTT TTCAACAAAT GCTACATGAC 
CGTAATGTTG ATCTGCACCA AATTGTCCAG CCTCAAATAC AACAGCAGCA TGACGTTTTG 
GTGTATGACT TACTTGATAA TCACGGTATT GAGCTCGATT ATTCCAATTA TGTGCATCAC 
CTAAATCACC TGAGATAGAT GTACCAAATT GTTTCATACG GTTATATACG TACCAAGTAC 
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ATGAATCATC ATAATCCTTG ATAGAACGTT 
CGTCAAACTG AGTTAATTGA TAGTCTTTAA 
5 GATCTGTAGC ATATGTTTTA GATAAGTGTG 

ATTTCCATGT TGGTTTATAA ATTGTTCGAT 
AGTAATCTTT TAGTGATTCT TTCGTGCTTG 

10 

ACAATTGATT ACCATCAGCT TCTAATGTGT 
CTTTGATACC GAATAAATTA TGGTTTGGTG 

J5 ATTCTAAGAT TGCTTGGGCA ATCATGACAG 

GATGTGCATC TTTAGCAATT GATTTGACAA 
TAAATTGTCC GCTATCATCA TTGTTAGATA 

20 CACGTGTATC CTTTTGATTA ACATCGTTAT 

TCAATTCATC TTGTGTTGGT AACTGTGGAT 
TTTTAGATTG AG ATG CAT AA TCTTTTTGTG 

25 AAATAGAGTC TAAAGCCGAA TCTGACATTG 

TTGCTTTATC GTCACTTGCT GGTTGACTAT 
AATTTGGTTG CTTATTAGAT GTACTTGGTT 

30 

TGTCTGCTTT ATCTTGTTTA GATGATTGCG 
TGTTTTTATT CGAATCATTT GTTGACTTTT 

35 TATCCGAATT TAAATTGAAT AAGTTTTGGA 

ATTTATTTTT GGTTAGCAAT TGGTTTATAT 
CAATSATATT GTTAGAGTCT GAAGTGCTGT 

40 TGTCTTGGTT ACTTGTATTA TTTTTGTCTG 

TAGAAGTTTC ATCGTCATTA GATTTTTTTG 
CTTTTTGAGG TGTATCAGCA TAAGCGgTAG 

45 TTGATAGCAA ATAAATTAAA ATTTTATTTT 

TATAATAATT AAGTGTGATA ATAAACTATG 
AGTTGATAGG TATCAATCGA CTAAATATCT 

so 

GCAAAAATAA ATTAATTTAC AAAAAATATA 
TGTGACAATG AAGAACGCAT TTAAATTATT 
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CATATTTATC TAAATCTGGC ATG CGTTCAT 490 

TAATACTGTT TAATTTCTTA G CAT AGTTTG 540 

ATGTTGCATC TTTATAAGAA TCGGCTTCCG 600 

TGCCATCAAT ACCATTTTTA ATAAGGTCAG 660 

GATATTTTCG GAATCCAGCA TTAATACTAT 720 

TAAAAGGAAC AGAATTCCCT TCaAAAGCAC 780 

ACwTAGCTAA AGCACTACGA CCTGAGTCAG 840 

ACGCATAAAT ATCGTTATCT TGACCAATGC 900 

ATTGACGTGT ATCTTTTGAG TCAACAACGT 960 

TACTAGGATC TGTTTCGAAT AATGATGTTG 1020 

TGAATGATTG AGCAGGTTTA GATTTATGTT 1080 

TCTTTGTATT AGATTTTTCA TTTTTGTCTT 1140 

TTTTCTTTGC ATCTTCACTG TATTGATCCA 1200 

ATTGATTATC TTTCGATGAA GATTTTTGAT 1260 

TTGATTGATT AGGTTGTGTT GGCTTTGGCG 1320 

TTGTATTGTT TGATTTAGGT GCTTTTTGAT 1380 

TATCAGTGTC ATTTTTGATG CTATTGTCAC 1440 

CGCCATTACG AGGTTGTTCG TAATCAGAAA 1500 

TTAAAGTTGT TAATGAGTAA TTATCATCGT 1560 

TGGTTTGTGG TAAATTCTTA TAAATAAAAT 1620 

CGTCTATAGT TTTAAATTTT TTGTCGTTAT 1680 

CTTTATCAAT ATCTTTACTT GTAGTATCCT 1740 

AATCATGAGA TGTTGTCTTA GCTGTAGTAT 1800 

GTGAAaCTAA AGTAGGTAAT ACGAGCGTAG I860 

TAGGCATATT TCGTATTCTC CCTTGAAAAA 1920 

ATTTGTTATA ATTTATCGTA TGCTGAAAAT 1980 

TCCAGTAAAT TGATTATACT AATTCACAAC 2040 

TAAAAAATAT GAATAATTCC TACATAGGAG 2100 

TAAAATGGAT CTGAAGAAAG TAGCTAAGAC 2160 
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TAACTTATGG 


; GCAATGTGGG 


ATCCATATGG 


CAACACGGGA 




2280 




TAATGAAGAT 


AAAGGCGACA 


CAATCAGAGG 


GAAAAAAGTT 


AATGTCGGTA ATAPfiATfVST 


2340 


5 


TAATACACTC 


AAGAAAAATA 


AAAGTTTTGA 


TTGGCAGTTT 


GTAAGTAGAG AG AAA G CTf'ia 


2400 




TCATGAGATA 


AAAATGGGTA 


AATATTTTGC 


AGGTATTTAC 


ATCCCAT CTA AG'l'IVA m r* iv 


2460 


10 


TGAAATTACA 


GGGACACTAC 


GTAAGCAGCC 


TCAAAAAGCA 


GATGTAGAAT TTA AnrSTr 1 A A 


2520 




TCAGAAGATT 


AACGCTGTTG 


CGTCTAAGCT 


AACAGATACT 


w x x w x \>nw x l \j i, V^.\j x x Vjn 


2580 




AAAAGCGAAT 


GAACAATTTA 


ATAAAACAGT 


AACTCGAG PA 


x xax lAurtnw >lr\Lrk_. InALAA 


2640 


1S 


AG CAGGTTTA 


ACTATTGAAG 


AAAATGTGCC 


GACAATTAAC 


AAGATAAAAZk 21 T^rWT a HP 7\ 


2700 




TTCAGCAGAT 


AAAGCTTTAC 


CTAAGATTAA 


* >J*»N— « 111 


A ATA A A ATM Y2 TSTXTttvmv 


2760 




TAACCACCAA 


GCGGATTTAG 


ATAAATATGC 


CAATGATTTTT 

a A X X X 


avjaaaml. 1 Alj uAAAi 1AXAA 


2820 


20 


AGGTGATATT 


TTAGATGCTC 


AGAAAAAATT 


AAACGAaGTC 


AATfJTITfirT A TTf car* a. iv r**T* 

^*>X A X A X X '^Wur^AAw 1 


2880 




TAATGAAAAG 


GCTAAGTTGA 


TATTAGCTTT 


AAATAATTAT 




2940 


26 


GTTAAATTTT 


GCAGCTGATG 


ACGTGCCAGC 


GCAGTTCCCT 


AAAATTAATP Zia/vapfriin 


3 000 


CATTGCGAGT 


CAAGGTATTG 


ATCAAGCTAA 


TGGACAGTTA 




3 060 




CACACAAGTT 


AGAAGTAGAG 


TCGGTGATTA 


TCAAGATGCA 


j\ x x k_ v. o LAAvjATTT 


3 120 


30 


AAATCGAAGA 


AACCAGCAAC 


AGATTCCTCA 


AAATAGCGCG 


GPGAAPAAfV^ laAPaTP&RR 


3180 




TAGTGCACCT 


GCAGCTGGTA 


ATGGTGTAGC 


ATCAACGCCA 


CCAAGTGCAC CAAGTGGCGA 


3240 




TACTGCACCA 


AATAATAATG 


TTACGCAAAA 


TACCGCACCA 


AATAGTAATA ATGCGCCTGT 


3300 


35 


ATCGACTACA 


CCACAAAGTA 


CAAGCGGGAA 


AAAAGATGGT 


CAAAGTTTTG TAGATATAAC 


3360 




AACAACACAA 


GTCAGCACAG 


CTAACGAGAA CACACAAAAC ATTACAGATA AAGATGTTAA 


^ A O rt 

3420 




ATCAiTGGAA GCGGCATTAA 


CGGGCTCTTT 


ATTATCATTA 


TCAAATAATT TAGATACCCA 


1 A Q f\ 

34 oLJ 


40 


AGCGAAAGCC 


GCACAAAAAG 


ATAGTCAGGC 


ATTACGTAAT ATTTCGTATG GGATTTTAGC 


3 




ATCGGACAAG 


CCTTCTGATT 


TTAGAGAGTC 


TTTAGATAAT 


GTTAAGTCCG GTTTAGAATA 


t £. n rs 
3 OUU 


45 


CACAACGCAA 


TATAATCAAC 


AATTTATCGA 


TACATTAAAA 


GAGATTGAGA AGAATGAAAA 


1 it f ft 
3 o o U 


TGTTGATTTA 


TCAAAAGAAA 


TTGATAAGGT 


AAAAGCAGCT 


AATAATCGAA TTAATGAATC 


O *7*> ft 




ATTAAGGTTA 


GTTAATCAAT 


TAAGCAATGC 


ATTAAAGAAT 


GGTAGTTCAG GAACTGCTGA 


3780 


SO 


AG CT ACT AAA 


TTACTAGATC 


AACTTTCAAA 


ACTAGATTCA 


TCATTATCAT CATTTAGAGA 


3840 




TTATGTTAAA 


AAAGATCTTA 


ACAGCTCTTT 


AGTATCAATA 


TCACAACGTA TTATGGATGA 


3900 




ATTGAACAAA 


GGGCAAACTG 


CATTATCCAA 


TGTTCAGTCT 


AAATTAAATA CAATTGATCA 


3960 
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AACAGTATTA CCAAGTATTG AACAACAATA 
CTTCTCGAAA GTGAAAAGTG ATGTAGcTAA 
ACAGTTAGAA CAGCGATTAA CTAATGCGAC 
ATTAAATGGT TATGATCAAG CGGTAGGATT 
GGCTTTATCA GATTTAGCTG ATTTTTCTCA 
GAAAAAAGCG AATAAAATTT TCAAGAAATT 
CGACACACTT AAGAATGATT TGAAAAAGCA 
GAAGACTGTT GATGTTTTCC CAGTTAAGGA 
TGCACTGTCA GTATGGGTAG GTGCACTCTT 
ACATAAGAGT CTAGAGTCAG TCTTAACGAC 
CTTTATAATG CTTGGTATGT TGCAAGCACT 
AAAAGCAGGA GTTGAGTCAC CTGTATTATT 
TTTCAACTCA ATCGTATATA CGTGCGTATC 
AATCGTATTG CTTGTATTAC AAATTGCAGG 
GCCACAATTT TTCCAAAACA TTTCGCCATA 
ACGTGAAACA GTAGGCGGTA TTGTTC CGGA 
GTTATTTGGT ATAGGATTCT TCGTTGTAGG 
GATGAAGCGC GTATCTGAAA AAGTTGACCA 
ACACATTAGG GTTATAGCTC CTTAATGTGT 
GTAATTTCTG TCTTTTATGG GACGGTT G TT 
TAGGACTAAT ATTACCGACA AAGTGAATAT 
AACCTTTTTG GATGTCATAG TGCTTATCGT 
TTGTAACTAA GCAATAAGCA TGTGGTTTAT 
TATATACTGC AAAATATTGA TTATCTACAA 
TTGTTATAGG AGTAGTATTT GGTTCATGAT 
CTAAGTGCAA ATCACGCAAT TGACCATTTT 
ATGTCGTATC GGAGGATTGT TGTGTCTCTA 
CAGTGCCAGC AGGAACATAA TAAAAGTCAC 
TGTCAAATTC ATGATTATCA ATCATGTCTA 



CATTAGTGCT GTTAAAAATG CTCAAGCAAA 
AGCTGCTAAC TTTGTGCGCA ATGACTTACC 
AGCAAGTGTG AATAAAAATT TACCAACGTT 
ACTAAATAAA AATCAGCCAC AAGCGAAAAA 
AAATAAATTG CCTGATGTTG AAAAAGATTT 
AGACAAAGAT GATGCAGTCG ACAAATTAAT 
AGCGGGTATT ATTGCAAATC CTATTAATAA 
TTATGGTTCA GGTATGACAC CATTCTATAC 
GATGGTAAGT TTATTAACGG TTGATAATAA 
AAGACAAGTG TTCTTAGGTA AGGCAGGATT 
CATTGTATCG GTTGGAGATT TGTTAATCCT 
TGTACTTATA ACGATTTTCT GTTCGATTAT 
ATTACTTGGT AACCCAGGJA AAGCCATTGC 
TGGTGGGGGA ACATTCCCAA TTCAAACTAC 
CTTACCATTT ACGTATGCAA TTGATTCATT 
AATCCTAATT ACAAAATTAA TTATATTAAC 
TTTAATTTTA AAACCTGTAA CAGATCCATT 
AAGTAACGTT ACAGAATAAA AATTAAATCC 
GGATTTTTAT GTTTTTAGAC AGAAGAGATA 
ATCATTGCTA TTATCCAGGA TGACTTACTA 
CCTCGTCTTC CGTAGTTAAA ATAAAGCTAG 
TTACTGTTAA AGTACCAGTA CCATCGATAA 
TGAATTTTAA ATCTCCATGA ATATCCCATT 
ATTGAGTTAC AGTGTGTGTG TCGATGTGAG 
TGCCTAATTC AATCACATCT TTACTTTGCT 
GATCTCGTCT ATCATAGTCA TAAATACGGT 
AAATTAAAAT ACCCGAACCA ATGGCATGGA 
CGGGCTTAAC AGGTATACGT TTGAAAAGAC 
TTAACGTCTG TTTATTATGT GCATGTACGC 
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25 



30 



GTTCGCCTTC GTGTTTTAAA G C GTAGT CAT CATCTGGGTG AACTTGAACA GATAATTTAT 
CATTGGCATC TAATACTTTA GTTAGCAGAG GGAAACTATC TCGTGAATCA TTAT CGAATA 
ATTCACGATG TTGTGACCAA AG TTGATCT A GGGTCATATC CTTGTATGGA CCATTGATAA 
TTGTATTAGG ACCATTTGGA TGTGCAGAAA TTGCCCAGCA TTCACCAGTT GTTTCATTAG 



S880 
5940 
6000 
6060 

GG AT AT CATA GTTAAATGCT TTTAATGCAT GACCGCCCCA AATTCTGTCT TTAAAAACGG 



w ^wv-^^wi itAftAAAL'GG 6120 

GTTGTAAAAA TAATGCCATA GTTAAAACTC CTCTATATTT TCATTAATAA GTTATAAATT 6180 
TCTGTAGTAC TGTTTGCATT AATTAG TG AT TGGCGTGTCT CATCATTCAT TAACGCTTTA 624 0 

15 GATAAGCGCT GAAGTATTTT TAAATGTGTA TCCTGACTGT TGTTTGGTAC GGCAATTAAG 6300 

AATATCAATT GAGGTAGACT ACCATCTAGA CTGTCCCATT TAACACCATG ATTATTTTTC 6360 

ATAACAGCTA CAATCGGTTG TTTTACAACA TCAGACTTTG CATGTGGAAT GGCCACGTTC 6420 

20 ATGCCAATAG CTGTCGTAGm tCcATTTCAC GTTCTAGTAT TGCATTTTTT AAATGCGATG 64 BO 

TGTGCTCTAC ATAACGGCAA ATTTTAAGTT TATGAATCAA CATATCAATT GCTTCGTTTC 654 0 

GAGACATGTC GTGATCAGTA ATTATCATAG TTTGTTGATC AAAAACATGA GAAGGTTTAT 6600 

TGAGATGTGA ATGTTTCGCG GTGTTATCTA CATTGTCAAC CTCTGTATCA TGTTGTGTAA 6660 

TATCTGTATC ATGAAGTTGC GTGTGTTGCG CTGGTGCATC TACTGCTATA ACTGGTGTAT 6720 

TGCGTTTTAA TAATAGTACA GTAGTCATTG TGACAAGACT ACCTACTATC ACTGCAAAGA 6780 

TAAACCATAA TACATGATCA ATACCACCTA ATACAGCCAC GATTGGACCT CCATGTGCGA 6840 

CTCTATCGCC GACACCACCA ATGGCTGCAA TGACTGATGC AATCATTGCA C CAATGATGT 6900 

35 TTGCAGGTAT AATGCGCAAT GGATCTTGGG CTGCGAAAGG AATAGCACCT TCAGTAATAC 6960 

CAAATAGTCC CATAGTGAAG GAAGCCTTAC CCATTTCTCT TTCGGAATGA TTGAATTTAT 7020 

ACTTTTGAAC AAACGTTGCT AAACCTAAAC CGATTGGTGG TGTACATACA GCAACTGCGA 7080 

40 CCATACCCAT AACGGCGTAA TTACCTTCAG CAATAAGTGC TGAGCCAAAT AAAAATCCTA 7140 

CCTTGTITAC TGGACCGCCC ATATCGAAGG CAATCATCGC ACCTATAATC ATCGCAAGTA 7200 

TAATAATATT AGCACCTTGC ATACTTTTTA ACCAGGTTGT TAATGCCTCA AAAATATTAG 7260 

45 AAATTGGTGC ACCGATTAAA AATATAAATA TCAATCCTAC AACGACCGAT GAAATAATGG 7320 

GAATAATAAT GATAGGCATA ATTGGTGCCA TTGCTTTTGG AACTTTAATA TCTTTAATCC 7380 

so ACTTTGCGAT ATAACCTGCT AAGAAACCAG CAACAATACC ACCTAAAAAT CCTGCGCCTG 7440 

CATCACTGCC ATAAAAACTA CCGTCAGCAG CGATAGCGCC GCCAATCATA CCAGGAACAA 7500 
GACCGGGCTT GTCAGCGATA CTAACAGCGA TAT AT C CAG C TAGTATTGGA ACCATAAATT 



7560 



55 
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ATCCTTTTGA TGTCGTTtCA CCGCCTAGAG TCAGCGCGAT GGCGATAAGG AGTCCACCAA 
CTACGATAAA AGGAACCATA AACGATACAC CGTTCATTAA ATGTTGATAC ACCATTTGAA 
TACCATTTTT AGACTTACCG CGATCTTTCG AATGATAATT TGTTTCAGAT TGATAAATAG 
GCGCATCTTG ATTAATGATA CG TTGAATTA GACCTCTCGG ATTATGAATC CCTTCGCGAA 
CATTTTCATT AATCAACCGT TTACCAACAA ATCGGGACAG ATCAACTTGT TTATCAG CTG 
CAATTATGAC ACCGTCAGCT TCTTCGATGT CTTGCGTAGT TAAAACATTT TCAGCACCAA 
CACCGCCCTG TGTCTCTACT TTAATATCCA CACCCATTTC TTTTGCTACC TGCTCAAGCT 
TTTCTTGAGC CATATATGTA TGTGCAATGC CATTTGGGCA TGAGGTAATA GCTACAATTT 
TCATAAAATC ATCTCCTTTT CTATATTGTA AGCGTATTCT CGATACTAAA AAAAAGAATA 
ATTACCGTTA CTAGTGGCAA TTATTCTTGT AAGTATTCAA ATAACTGTTG CTTTAAACTA 
TGATCATCTA AACTACATAA ATGGTTCACT GAATCATCAT CCAAGTTAGC AATTAATTGC 
ATCATTTGTT TTGTAAAAGC TTTGTCTTTA TGCGAAATCG CTAAGAAAAA GACAAGTTTG 
ACATCGTGTT GTCG CCAAGG AAAAACATCT TTTGTG CGAA AAATAAGCAC ATGTGATTGT 
AAAACTTTTT CAGGATCTCC ATGAGGAATC GCCATAAAAT TACCTATGTA TGTAGAAGAT 
GATTTCTCAC GCTCTAAAGC TGATTCGATA TATCCTTCTA CAATCGCATG ATGTGCTTGT 
AATATTTTTT GAGCTTCTTC AAAAATTTGC ACAGTATGCC GTGATTTTTG TTCAGTATTT 
ACGACAAGGA AATTGACAGT GTCCATATGA TGATGTGCTT GAACCGGATT TTGCTTTTGC 
TTCACAACGT GTCTGATTTT GTGACGATCA TCTTCAGAAA AT AATGGTG C AACCTTGATA 
GTCGTCAGGT GCTTAGGAAG TATGTTTAGC GTTTGTTTAG GAATATCATG GGTCGTTATT 
AATAAATCTA CATTGTCAAA GTGATAGTGT GTTATATTTT CTAGTTTAAT CGTATTTATC 
ACTGACAACT CTTCGGATAA GTTATTTATT TTAGTTTCTA AAAAATTCGA CACACCTAGA 
CCATAATAAC AAGCAATGAC TACATTTAAT TGTGTTTTGG TACGACGCTC GATGGCAGCT 
TGAAAATGAA TTGTTAAAAA TGCAATTTCA TCTTCGCTCA TCT CTATATC AGTATCAATT 
GCTAATTTAT CAATCGCTTC AAAAAGTGTG TTAAACACAA AGGGATAGAG TTTTTTAATC 
TCTATAACTA AAGGATTGTT TAAATAAATG TTTTGAGTGA TACGTAAATA TGCTTTACTA 
AAATGATTAT ATAAATTTTG TTGTAAAATC GAATCTTCAT TGAAAGGTAC ATGAATACGT 
TGCTGCATCA ATTCG ATTAA GCGATCAATA TAACTTTGTA TAAATATACG TTCTATGCCA 
ATATCGAGTT TATTAAAATG ATAAGCAATA AAGAATGAAA ACATATTGAT TACTTTTTCG 
TTCAAGTCAT AACCTAATCT TTCGTTGATT TGCTTAATGC AAGATTGAGA TATCAATTTT 
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w 



20 



25 



30 



4$ 



50 



SS 



AGATGAATTA AAAGCTGTTG TATTTGAATA TCAGTTGTTT CAATACTATG TTGTTGAAGT 
GTCTCTTGTA TAATATG CG A AATCATCCTT TGGTGTGAAT CAGGTAATTC aTTTAAAATT 
AGGTCTTCAA CATGTACATG CCCTGATGAT AATTGATTTA AATGGATGAT GGCATTAGTG 
ATATCATTAT CTGTTCCATC GAC 
(2) INFORMATION FOR SEQ ID NO: 167: 



822 

BNSDOCID: <EP 07865 19A2_L> 



9480 
9540 
9600 
9623 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1021 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
is (D) TOPOLOGY: linear 



Ui) SEQUENCE DESCRIPTION: SEQ ID NO: 167: 
-wv.^^v^rww ^uiuh\ji uaAtuALtAAA GCGATAAAAA TGTGACTAAA TCATCTCAAG 
AGGAAAATCA AGCAAAAGAA GAATTACAAA GCGTTTTAAA CAAAATTAAC AAACAATCAA 
GTAAGAATAA TTAAAAAATT TTGATATTGT CTATGTTTAT AGTTCACAAG CCATTCAACG 
TATTGTAAAC TAAGGATAGT GTATTTTTTT AATAGTAATT TGTCAGGAGG TGCCTATCTA 
TGGAAGAACA TTACTACGTA AGTATTGATA TTGGATCATC AAGCGTAAAA ACAATAGTAG 
GCGAGAAATT TCACAATGGT ATAAATGTGA TAGGTACAGG ACAAACCTAC ACGAGCGGTA 
TAAAAAATGG TTTAATTGAT GATTTTGATA TTGCGCGACA AGCAATCAAA GACACAATTA 
AAAAGGCATC AATCGCTTCG GGTGTTGATA TTAAAGAAGT TTTCCTGAAA TTAC CTATCA 
35 TTGGAACGGA AGTTTATGAT GAATCAAATG AAATCGACTT TTATGAGGAT ACAGAAATCA 

ACGGTTCACA TATCGAAAAA GTATTAGAAG GTATTAGAGA AAAAAATGAT GTGCAAGAAA 
CAGAAGTAAT TAATGTGTTC CCGATTCGTT TTATAGTCGA TAAAGAAAAT GAGGTTTCAG 

40 .^CCCTAAAGA_ ATTAATTGCC AGACATTCAT- TAAAGGTTGA - AGCAGGCGTA- ATTGCTATTC 

AAAAATCG^T TTTAATTAAT ATGATTAAAT GCGTAGAAGC ATGTGGTGTT GATGTATTAG 7 80 

ATGTTTACTC TGATGCATAT AACTATGGTT CAATCCTAAC AGCTACTGAA AAAGAGTTAG 840 
GTGCATGTGT CATTGATATT GGTGAAGACG TTACGCAAGT TGCTTTTTAT GAACGCGGTG 900 
AATTAGTAGA TGCTGATTCT ATCGAAATGG CAGGGCGTGA TATTACaGAC GATaTTGCAC 960 
aAGGrTTaAA CACTTCTnAT GAAACTGCTG nAAAAAGTTA AACACCAATn TGGTCATGCA 1020 
T 

(2) INFORMATION FOR SEQ ID NO: 168: 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
■720— 
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(A) LENGTH : 7963 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY : linear 

5 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 168: 



10 


TAATCTATTA 


TAAAAACTGT 


CCATACCCTT 


TGATTACCTT 


CTCTTCAGGT 


ACAGGCCACA 


fa 0 




CTTGAGGCCA 


TAAGCCATAT 


G CTTGCTGTG 


AATAAAATTG 


TG C CATTTGT 


AACAATATAA 


1 O A 




TATATACAAA 


TAAACACCCA 


ATAATTGCTG 


TCACTAATGG 


ATATGATAAC 


CAAACCIATTA 




75 


ATAAAACTGC 


AATAATTACT 


AACCTAAAGA 


TAATATTAAA 


X X w X ^« X w 




"5 it 




AGCTTCTAAT 


AAATAAGAAT 


AAATACATCG 


CATTAGAGTT 


AAATTTACTA 




J uo 




CTGGTAAAAG 


TATATCTAGA 


TAACTTCTTC 


TGACTGCAGA 


TTCTTTPAAA 

X X V- X X X v» *w»*v 


x X 1 XX rtV-J-V 1 


"if n 
JOtl 


20 


CGGTGAACAT 


ATTAACAAAT 


TTATAATAAT 


TCATATGATG 


TCGATGTTCG 


#*X XVJ\_nnX^_rt 


*t ^ u 




TTTTCTCCCA 


AGGATACAAA 


AAGCCTGGTT 


TATATTTTTT 

X^%X**X X X X X 1 


AACTAAAAAT 


TCTATTAA A 


A ft CS 


25 


CAGGCAAAGC 


AAC CATCACA 


AATGCGATGT 


ACCATTTTGG 


AGCTAATAGT 


AAC3TAATATR 


c a rt 


TTAGAGCAAA 


GGTGATGAAT 


GATATTAAAT 


TAACTTGCCA 


TcrrrrAAGT 

A AAA A «VbW A 


CCCGATTGAT 


600 




ACCATTGCCA 


TCTTAAGCGT 


AAACCAACAT 


ATGGAAAAAT 


TAATGCACTG 


ACTCCAAAAC 


o o u 


30 


AAATATAAAA 


TGC CACATTA 


TGTTGATTAA 


TATTGTAAAA 


CAACGGGAAC 


ATTACAATAA 


720 




CAATAATGAG 


TTGGATTAAT 


ATGCGCGCAA 


AGTAACTATA 


TAAAATCGCA 


TGACGCATAA 


780 




ATTGAGACAT 


GTGTTTTTCA 


AATGGTAATA 


AAAAGATTTT 


ATCCgCTTCT 


TTTAACAGTG 


840 


35 


GTCsCmTTGG 


AAAAATAGrT 


GTCAACGCAA 


CAATCACTGC 


TGCTATTaAT 


GAAAAATTGa 


900 




TATTCGTTGG 


aatatutttt 


AACCATTcAC 


CATATCCArA 


AATAAATGCA 


CCCAGCAAAA 


960 




TAAGTAAAAA 


GACCATGAAA 


TGACCATTAA 


ATATAAACTT 


ATTATAATAA 


TTTTtCTCTT 


1020 


40 


TACGAAGGGC 


ATGTAATCTT 


TTATTAAATA ATGTGGTAGC 


TTGGTTACGC 


ATGTACATCT 


1080 




CCACCTTGCG 


TCACATGAAT 


ATATATATCG 


TCTAATGTTT 


GATTATGTAA 


GCCAGTTTGT 


1140 


45 


TGTCTCAATG 


CTTCTAAATC 


TCCAAATGCA 


ACGACTTCAC 


CTTCGTCTAG 


TATGaTAAAA 


1200 


CGATCACAGT 


AACGTTCAGC 


TGTTGCTAAA 


ATATGTGTAC 


TCATTAGAAC 


GGTTCTACCT 


1260 




TCGTTTTTCT 


TTTCAACCAT 


TAAATCTAAC 


ATGGATTGAA 


TTCCTAATGG 


ATCTAGGCCA 


1320 


SO 


AGGAATGGTT 


CGTCTATAAT 


ATACAATTCG 


GGATTAACGA 


TAAACGCACA 


AATAATCATG 


1380 




ACTTTTTGTT 


TCATCCCCTT 


AGAAAAATGA 


CTCGGAAAAA 


CTTTCAACTC 


ATTTTCTAAA 


1440 




CGGAATGTCT 


TTAATAATGG 


CATTGCTCGA 


TTCATCGTTT 


CATCACGATC 


AATATCATAT 


1500 



55 
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TCCGGAATAT AAGATAACTT TCTT CTATAA GCCTCTATGT CATCATTAAT GTTGATATCT ~ 162 

GAAATTGATA GAGATCCTTC CATAGGTGTA AGCAATCCTA GCATATGTTT AATCGTTGTA 168 

CTCTTACCAG CGCCATTAAG GCCAATAAGT CCAACAATTT CGCCTTTGTT TAATTCAAAA 174 

TTTATATCTT TAATTACAGG GCGTTTTCCA TATCCACCTG TAAGCTGTTC TACTTTAACT 180 

GTCATAAGGC ACCTCCATGA CTTATATTGT ACCAAAAATT ATAAAATGCT CATATTAAAT 186( 

ACACATGTCC TAATATCGAA TTTTTAGCGA CAATGTTATA ATGAATGGTA ATACTAGTTG l 92 ( 

AAAAGGAGTG TAGTCATCAT GTCAGAAACA ATTTTCGGCA AAATTTTAAC TGGAGAAATT 198( 

)S CCTAGCTTTA AAGTATATGA AGACGATTAT GTCTATGCCT TTTTAGATAT ATCACAAGTT 204< 

ACTAAAGGAC ATACGTTATT AATTCCTAAA AAAGCTTCTG CTAATATCTT TGAAACTGAT 2 10C 

GAAGAAACAA TGAAACATAT CGGTGCAGCA TTACCTAAAG TAGCAAATGC TATTAAGCGT 216C 

20 GCATTTAATC CTGATGGTTT AAACATTATT CAAAATAATG GTGAGTTTGC AGATCAATCT 222C 

GTATTTCATA TTCATTTCCA CTTAATTCCT CGATACGAAA ATGATATTGA TGGATTTGGT 228C 

TATAAGTGGG AAACACATGA AGACATTTTA GATAACGATG CAAAACAACA AATTGCTGAA 234C 

25 CAAATTCAAG CACAATTTTA AATGTATGCT TAATCTAAGC TGGAACGGGT ATAATATGAT 24 0C 

TAATATTATA ACAATTGCGT TTGAAGTGAT AACATCAAGG TTAGCAATTT TAAACAAAAT 2460 

GAGTTATCAA GATAACAGAT GTTAAAAGTG AGGAGAATAT AAATGAAAGC ATCACGCATT 2520 

30 ___ 

CTATTCGGTA TCGGTGTTGG CGTAGCAG CT GGTTTTGTAG TTGCACTTCA AGGACGTGAC 2580 

GACAAAAGTG TCAAGAACAA CACGATCGAT CGTACTGCCC CTACTGGTTC AAAATCAGAA 2640 

CTACAACGTG AATTTGAAAC GATTAAACAA AGTTTTAATG ACATTTTAAA CTATGGTGTT 2700 

CAAATTAAAA ACGAAAGTGC GGAATTTGGT AGTTCAATTG GTGGTGAAAT TAAGTCATTA 2760 

CTTTCAAACT TCAAATCTGA CATTAATCCT AATATTGAAC GTTTACAGTC ACACATCGAA 2820 

AATTTACAAA ATCGTGGCGA GGATATTGGA AACGAAATTT CTAAGTAGCA GGTTACGTTC 2880 
TCGATCACAA "CTATTmAT™^ 

AAACGAGATG ACATTAGAAA TTAGATATTT CTTGTCATCT CTTTTTTAAA ACTCAAATGA 

4S ACTTATGTTT ACAAATTATA GGAAGACATT GTTTGTAGTG ATTTTCGCTT AAATCATATT 3060 

TATGAATTGA TTGAAAACAT TGCTTAGGAT TCATTGTGTT ATCCtTGCAC TTTGATTACG 3120 

CTTTACTTAA ATCATTATCG ACAAACAACA TACTTATATT TTCATTGAGC CGAACCTTAT 3180 

ATACACATTA CATATACCTT ACTTGCACAA ATTATTAATC TGGTGTTTAT TATAATTACA 324 0 

TATCACTATA TTTTTAGCAT TTGTATAACT TAGTTGGTCA AAAGATGCTT TTGCATATGC 3300 



36 



40 



SO 



2940 
3000 
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TTTCATAAGT GATGCTTTAT TAGCAAGAAT ATGTGTTCGC AGAAATTTGT TCTGCATTCT 3420 

ACTTCTACGC TAGTCAATCA GACAATTTTA CCAATCCCCA CTTTCGCGTT TCAAATCAAA 34 80 

CAATACGTCG CTCCTTTCTT CTTATATAAC AATTCTTCTA ACATGATATG TTACTATTGA 3 54 0 

ATTACTGAAC CTGAGTTAGT TATAATCTAA CTTATATTGA AAAGAGATGA GGCGTAAGAT 3 600 

ATGTTTTTAT GTAAAAGACA AATTGATATC AATGCACGAT TTGGTTTGCC TAGAATTGCA 3660 

TTTATGAGTG CAGTTGCAAC CATCATTATG TTTTTAGTTA GTTATGAAGT AATGTATTTT 3720 

TTATCTAATA CGCCATTATC AGATAGACAT TTTCTCATCT TTTTATTACT TGTATTTATG 3780 

ACGTATCCAT TACATAAAAG TATACATTTA TTATTTTTCT TACCATATAG AAAATCGTTT 3 84 0 

AAAGTTCATA AGTTAACTAA AAGAAAATGG CTTATATTCT ATAATACCTA CGTCAATCAA 3 900 

CCTGTACACA AATTTTATTT TTGCATTAAC TTAATATTGC CGTTAATTAT CTTATCTGCA 3 960 

ATGTTCGTTT ATCTAACAAT TTCATTCCCG CAATATGGAC ATTATTTTAT GTTCTTATTG 4 020 

GCATTGAATT TCGGTATTTC CATTACAGAT TTATTATATT TAAAAATAAT TATATTTTCT 4 080 

AATTATGGAC AATATATAGA AGAACATAGT ACAGGTATTA ATATTTTGAA AAAAATTAAA 414 0 

25 AATCCATATC ATTTATAACA AAATAATTAT AGCAAGGTGT TATTATTTGT TTTTAGGCTA 4200 

TGTAATAgcT tACAATCAAA TGTATATAGA CCTTGTTTTT TT A TTTTCAT CAATTTCTAC 4260 

CCCTAAACCT AATGCTCTAG TCTGATGTCA TGGGTTATTG ATTGGTGATA ATATAAAACT 4320 

30 ATGTTATATT CACGATGATT AACTTACAAA GGAGTTTCAA CTATGAAGAT GATAAACAAA 43 80 

TTAATCGTTC CGGTAACAGC TAGTG C TTTA TTATTAGGCG CTTGTGGCgC TAGTGCCACA 4440 

GACTCTAAAG AAAATACATT AATTTCTTCT AAAGCTGGAG ACGTAACAGT TG CAGAT ACA 4500 

ATGAAAAAAA TCGGTAAAGA TCAAATTGCA AATGCATCAT TTACTGAAAT GTTAAATAAA 4 560 

ATTTtTAG CTG ATAAATATAA AAATAAAGTT AATGATAAGA AGATTGACGA ACAAATTGAA 4620 

AAAATGCAAA AGCAATACGG CGGTAAAGAT AAATTTGAAA AGGCCCTTCA ACAGCAAGGT 4680 

TTAACAGCCG ATAAATATAA AGAAAATTTA CGTACTGCTG CTTATCATAA AGAATTACTA 4740 

TCAGATAAAA TTAAAATCTC TGATTCTGAA ATTAAAGAAG ACAGCArGAA AGCTTCACAC 4 800 

ATTTTAATTA AAGTTAAATC TAAGAAAAGC GACtnAAGAAG GCTTAGATGA TAAAGAAGCG 4 860 

AAACAAAAAG CTGAAGAAAT TCAAAAAGAA GTTTCAAAAG ATCCAAGTAA ATTTGGTGAA 4 920 

ATCGCTAAAA AAGAATCAAT GGATACTGGT TCAGCTAAAA AAGATGGCGA ATTAGGTTAT 4 98 0 

so GTTCTTAAAG GACAAACTGA TAAAGATTTT GAAAAAGCAC TATTTAAGCT TAAAGATGGT 5040 

GAAGT AT CAG AGGTTGTTAA ATCAAGCTTT GGATATCATA TTATTAAAGC TGATAAACCA 5100 
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AAAAATCCAA AATTATTGAC 


•TGATGCATAC 


AAAGATCTAT 


TAAAAGAATA 


CGATGTTGAC 


5220 




TTTAAAGATC 


GTGATATTAA 




uAAtxATAAAA 


TCTTAAACCC 


TGAAAAACTT 


5280 


5 


AAACAAGGTG GCGCACAAGG 


UuvjAv_AA.I 


WjWVTGAGCC 


AATAACACAA 


AACCGAGCGA 


5340 




CGGTGGTTCA AAAATCATAC 




c-tiGi i i i~i, _ rc 


GCATTAAAAA 


TCGGACAGAT 


5400 


10 


GAG CTCATG T TTCAGTATAC 


TCATCTGTCC 


GATATCl l"\l~r 


AATTCTTAAT 


CGAGTGATTC 


5460 


AGG ATTG TAG 


AATCTACGAT 


TTTCAAGACC 


AAAT A 1 1 1 1 A 


TCTGTAAACT 


GACCCTTGTC 


5520 






TATGCCTTTT 


CAAACATATT 


CATTCTAGCA 


TCGATATTAT 


CGATATAGCA 


5580 


15 


TAAAATTTCT GCTTCTTTTA 


AGTATGGCAG 


TTTTGGAGAA 


C CAT ACT CTA 


ACTTACCATG 


5640 




ATGAGATAAA ATCATATGTC 


TTAACAACAT 


GATTTCTTCT 


CCTTCAATGT 


TCAATTCACG 


5700 




AGCTGCTTCA ACTACTTCAT 


CACTCGCAAT 


CGAGATGTGT 


CCTAATAAGT 


TACCTTCGAC 


5760 


20 


TGTATACGAC 


GTCGCAACAG 


GAC CACTCAA 


TTCTCTAACT 


TTACCAATAT 


CATGCAAAAT 


5820 




AATACCACTA TATAACAAAC 


TTTTGTTTAA 


CAATGGATAA 


ATGTCa CAAA 


TTGATTTTGC 


5880 




AATACGTAAC 


ATCGTTAATA 


CATGATAGCT 


TAAGCCACTC 


GCAAAGTTAT 


GaTGATGAGA 


5940 


25 


ACTAGCAGCT 


GGATATGTGT 


AAAATCGTTC 


TTGATATTTT 


TTCAATAAAT 


GACGTGTGAT 


6000 




ACGTTGTAAA 


TTAGCATTTT 


CAATATCTAG 


CAAATAATGA 


GAAATCTCTT 


CTTGTATTTC 


6060 




TGCCGGTGAT 


AAAGGTGCAC 


CATCTACAAA 


TTGTTCTGTT 


TTTAATTGAT 


CTTCAGTTGT 


6120 


30 


CGCTAGTCTA 


ATTTGGTTGA 


CTTTCATCTG 


TTTATTTCCG 


CGATAGTTTA 


TGATGTCACC 


6180 




TTTAACATGT 


ACAATTTCTT 


CAGGCTTGAT 


TGTTGCCATA 


TCATTTTrTG 


TAGCCGTCCA 


6240 


35 


AAATTTCGCT 


TCAATTTCAC 


CACTTTTATC 


TTGCAAATGT 


AATGTCATAT 


AATCTTT AC C 


6300 


TTGTGCTGTT 


ACAC CCTGTG 


TAGCTTTATG 


CACTAAGAAA 


AAGTGATCAA 


CTGAATCTCC 


6360 




GGGATTTAGA 


TTCT CTATAT 


TTCT CATCGT 


TTCCCGCCTT 


CCTCTATTTT 


GTTTAATGTA 


6420 


40 


ATCACTTCTT 


TTGATGGAAC 


AATATTATCT 


TTTACACATG 


TAAAGTATAG 


TACTTGATAG 


6480 




TGTTCTGATA 


ATGATCGTAA 


ATAATTCAAC 


ATTTTTTCAG 


TACGTTTTTT 


ATCAAAATGA 


6540 




ACAAATGCAT 


CATCAACAAT 


TAATGGGAAC 


GGATAATATG 


GTCTTAGTAC 


CTTAATTAAA 


6600 


45 


CTGATACGTA 


AAGCTACATA 


AAGTAATTCT 


TTTGTAGATT 


GACTTAGTTC 


AACAGGATCA 


6660 




TATAATTGAC 


CATTAACATG 


TTTAACCGTA 


ATTGAATCTT 


CATTATAGTT 


AATCATCGTA 


6720 




TATCTGCCAT 


CTGTTAAATG 


CTTCAATATT 


TCTACCGCTT 


CATTAATAAC 


TTGAGGCAAA 


6780 


50 


CGTTTATCTT 


taatttgttt 


AATGTGTTCA 


TCAACTAAAC 


TTTGTAAATA 


ACTTAAACTT 


6840 




GCCCAATCTT 


TTGCGATATC 


ATTAAGTTGA 


TTTTTAAGAC 


TGTGATATTC 


ATGTCTTAAA 


6900 
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is 



20 



2S 



G CTTGCATTT 


CAAGATATTG 


CTCATTATAT 


TCGTCAACTT 


GAGTAGCCAA 


TAAATGATCT 


7020 


TCTTCTTCAA 


GTTGTGCAGT 


TGTTTTTTCA 


CTTAAACTAG 


AACTTAATTC 


ATAAGAATAG 


7080 


TTTTGGTTCT 


CAAGATATTT 


AGTTAAATCA 


TTAAAACGAC 


TCAAATTACT 


AGTATAAGTT 


7140 


TGGTAATCTT 


CATGATGTTG 


GTAAAAATCT 


TCTTCAGTAC 


CAACATTGAT 


AAAATCGAAT 


7200 


AGTGCTGTAA 


TTTCTTTATT 


ATTTTCTTCT 


AATTGAGCAT 


TTAAATGATT 


TAATTCATTT 


7260 


GTAACAAGTT 


TGGTATTTTC 


AGCATTAATA 


CGCCATTTTT 


CATTCGTGTC 


TTCAGCTGAT 


7320 


TTCAACCATT 


GT t GCACATC 


GTGGAATAAA 


GATAATTTGT 


TGAAATAAAC 


AAATTGTGAT 


7380 


TTTGTAACAG 


CTTCAGCATG 


ATTGTAGAAT 


GTATCTAATT 


CTTGAACCAA 


TTGCTGGCGT 


7440 


TGTTGATTTA 


AATCACTGAT 


ATGTTGATCT 


AATGCTTTAA 


TATTCGCCAT 


TGTAGAAATA 


7500 


CTATCAACAA 


TTAAATCATT 


TGAAATTTTA 


GATGATAAGT 


ATAATT CATC 


CTTAACGTTC 


7560 


TCAACTGTCG 


ATTGTAATTC 


ATCATGACGC 


CCTTTCGCAT 


CATTTAAACG 


ACCTTCAATA 


7620 


TACTGACGTT 


TCTCTTCTAA 


AATATCTTTA 


rrrrrcAAAG 


CTTGTTGCCA 


GTGATCACGA 


7680 


ATGCGATATT 


GCTCATCAAG 


ATCAAAATCT 


AAGTCATAAT 


TTTCATCTAA 


AATGGCTAGT 


7740 


TGTGCTTTAA 


TTTCTTCGAT 


TTCATCTGTG 


ATGGCCTCGC 


TATAATCTAC 


TTCTTTTGAT 


7800 


TTAGACATGA 


TGATACCGAT 


AACAAATACT 


AAAGTTAATA 


CTGCGAAAAT 


AATACCAAAC 


7860 


AACATGTTGT 


TTGAAATAAA 


TGAGAAGGCA 


GTTAAACCAA 


TACCTACTAA 


TGTTAAAAGr 


7920 


ATAAACGTTG 


TTCGkAACAA 


TTTTTGACGT 


TTTTGttTTT 


CTT 




7963 



(2) INFORMATION FOR SEQ ID NO: 169: 

(i) SEQUENCE CHARACTERISTICS: 
3$ (A) LENGTH: 3 958 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
Z (D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 169: 
ATATTGTCTT TACAATAGTT TGCTATGGAG GTAATTAACC AATAGGAGGA ATTTATAATG 60 
GCAGTAATTT CAATGAAACA ATTACTAGAA GCGGGTGTTC mCttCGGTCA CCAAACACGT 120 

45 

CGTTGGAACC CAAAAATGAA AAAATATATC TTCACTGAGA GAAATGGTAT TTATATCATC 180 
GACTTACAAA AAACAGTGAA AAAAGTAGAC GAGGCATACA ACTTCTTGAA ACAAGTTTCA 240 
SO GAAGaTGGTG GACAAGTCTT ATTCGTAGGA nCTAAAAAAC AAGCACAAGA ATCAGTTAAA 300 

TCTGAAGCAG AACGTGCTGG TCAATTCTAC ATTAACCAAA GATGGTTAGG TGGATTATTA 360 

55 
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w 



25 



30 



35 



GAAGATGGTT TATTCGAAGT ATTACCTAAA AAAGAAGTAG TAGAACTTAA AAAAGAATAC 
GACCGTTTAA TCAAATTCTT AGGCGGAATT CGTGATATGA AATCAATGCC TCAAG CATT A 
TTCGTAGTTG ACCCACGTAA AGAGCGTAAT GCAATTGCTG AAG CTCGTAA ATTAAATATT 
CCTATCGTAG GTATCGTTGA CACTAACTGT GATCCTGACG AAATTGACTA CGTTATCCCA 
GCAAACGACG ATGCTATCCG TGCGGTTAAA TTATTAACTG CTAAAATGGC AGATGCAATC 
TTAGAAGGTC AACAAGGCGT TTCTAATGAA GAAGTAGCTG CAGAACAAAA CATCGATTTA 
GATGAAAAAG AAAAATCAGA AGAAACAGAA GCAACTGAAG AATAAT CAAC TGTTGAATCT 



480 
540 
600 
660 
720 
780 
840 

^ GACTTAGATA TAGTTTAAAT GGGTGATAAG ATATTAATGC TTATCACCTT TTTTAAAAAG 900 

AAAATCGAGG CAAATTACAA ATATTCAATT AGAGTATTGG CAATCTTGCC TATAATAATG 
CTAAAATCAT AATATATAAn ATGATAACTT ATTGGAGGAA TAATGAATGG CAACTATTTC 
20 AGCAAAACTT GTTAAAGAAT TACGTGAAAA AACTGGCGCG GGTATGATGG ATTGTAAAAA 

AGCGCTAACT GAAACTGATG GTGACATCGA TAAAGCGATT GACTACCTAC GTGAAAAAGG 
TATTGCTAAA GCAGCTAAAA AAGCAGACCG TATTGCGGCT GAAGGTTTAG TACATGTAGA 
AACTAAAGGT AACGACGCAC TATCGTTGAA ATCAACTCTG AAACAGACTT TGTTGCTCGT 
AACGAAGGTT TCCAAGAGTT AGTTAAAGAA ATCGCTAATC AAGTATTAGA TACAAAAGCT 
GAAACTGTTG AAGCTTTAAT GGAAACAACT TTACCAAATG GTAAATCAGT TGATGAAAGA 
ATTAAAGAAG CAATTTCAAC AATCGGTGAA AAATTAAGTG TTCGTCGTTT TGCTATCAGA 
ACTAAAACTG ATAACGATGC TTTCGGCGCT TACTTACACA TGGGTGGACG CATTCGTGTA 
TTAACAGTTG TTGAAGGTTC AACTGACGAA GAAGCAGCAA GAGACGTTGC TATGCATATC 
GCTGCAATCA ACCCTAAATA TGTTTCTTCT GAACAAGTTA GCGAAGAAGA AATCAACCAC 
GAAASAGAAG TTTTAAAACA ACAAGCATTA AATGAAGGTA AACCAGAAAA CATCGTTGAA 
40 AAAATGGTGG AAGGACGTTT ACGTAAATAC TTACAAGAAA TTTGTGCTGT AGATCAAGmT 1740 
TCGTTAAAAA CCCTGATGTA ~A<SG TT^G 

TTGACTTCGT ACGCTATGAA GTAGGCGAAG GTATGGAAAA ACGCGAAGAA AACTTTGCGG 
45 ATGAAGTTAA AGGACAAATG AAATAATCTG TCATAAAGTA AAACAAGGAA GAAGACACCT 

TTAATGTTGC TTTATTAAAA TGTAAATCAT TCTAATAAAA CGACAACTGT GTCTTCTTTA 

CTTGTATATG TTACATATAT TCACGATAGA GAGGATAAGA AAATGGCTCA AATTTCTAAA 2040 
SO TATAAACGTG TAGTTTTGAA ACTAAGTGGT GAAGCGTTAG CTGGAGAAAA AGGATTTGGC 2100 

ATAAATCCAG TAATTATTAA AAGTGTTGCT GAGCAAGTGG CTGAAGTTGC TAAAATGGAC 2160 

55 



960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1S00 
1560 
1620 
1680 



1800 
1860 
1920 
1980 
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TTAGGTATGG ACCGTGGAAC TGCTGATTAC ATGGGTATGC TTGCAACTGT AATGAATGCC 22 8 0 

TT AG CATT AC AAGATAGTTT AGAACAATTG GATTGTGATA CACGAGTATT AACATCTATT 234 0 

GAAATGAAGC AAGTGGCTGA ACCTTATATT CGTCGTCGTG CAATTAGACA CTTAGAAAAG 24 00 

AAACGCGTAG TTATTTTTGC TGCAGGTATT GGAAACCCAT ACTTCTCTAC AGATACTACA 24 6 0 

GCGGCATTAC GTGCTGCAGA AGTTGAAGCA GATGTTATTT TAATGGGCAA AAATAATGTA 252 0 

GATGGTGTAT ATTCTGCAGA TCCTAAAGTA AACAAAGATG CGGTAAAATA TGAACATTTA 258 0 

ACGCATATTC AAATGCTTCA AGAAGGTTTA CAAGTAATGG ATTCAACAGC ATCCTCATTC 264 0 

TGTATGGATA ATAACATTCC GTTAACTGTT TTCTCTATTA TGGAAGAAGG AAATATTAAA 2700 

CGTGCTGTTA TGGGTGAAAA GATAGGTACG TTAATTACAA AATAAATTTA GAGGTGTAAA 2760 

ATAATGAGTG ACATTATTAA TGAAACTAAA TCAAGAATGC AAAAATCAAT CGAAAGCTTA 2820 

TCACGTGAAT TAGCTAACAT CAGTGCAGGA AGAGCTAATT CAAATTTATT AAACGGCGTA 288 0 

ACAGTTGATT ACTATGGTGC ACCAACACCT GTACAACAAT TAGCAAGCAT CAATGTTCCA 294 0 

GAAGCACGTT TACTTGTTAT TT CT C CAT AC GACAAAACTT CTGTAGCTGA CATCGAAAAA 3000 

25 GCGATAATAG CAGCTAACTT AGGTGTTAAC CCAACAAGTG ATGGTGAAGT GATACGTATT 3060 

GCTGTACCTG CCTTAACAGA AGAACGTAGA AAAGAGCGCG TTAAAGATGT TAAGAAAATT 3120 

GGTGAAGAAG CTAAAGTATC TGTTCGAAAT ATTCGTCGTG ATATGAATGA TCAGTTGAAA 3180 

30 AAAGATGAAA AAAATGGCGA CATTACTGAA GATGAGTTGA GAAGTGGCAC TGAAGATGTT 324 0 

CAGAAAGCAA CAGACAATTC AATAAAAGAA ATTGATCAAA TGATTGCTGA TAAAGAAAAA 3300 

GATATTATGT CAGTATAAAA CTAATATACA ATGACATATT AAAATGCCAG TATTAAACGA 3360 

TAATGTAACA TTTAAAATGG GCATGTTTAA TTAAATCAAA GATGCATGTG ATAATTTAAA 3420 

TTCAGAATGA GCATAAAAAT GGTGTTTAAA CAAGTTAATT AAACATATAC TTTATAAATA 3480 

ATAGGCATTA GGTATATTGC TATAATAAAG TTATGTAATT TTTAACCTCA GTATGTATGT 3540 

CACATTTCTG GTGTAAACTG TACCGAGTCA GACTTTGGTA CAGTTTTTTT ATTTGCTTAT 3600 

TCAATGCATT AAATGAGTAT GATAAAATGA TAATGATTGT TTAGTAACTT ATACTATATG 3660 

ACAGAGATGA TCAGGCTCGG AGGAAAGACC ATGTTTAAAA AGCTAATAAA TAAAAAGAAC 3720 

ACTATAAATA ATTATAATGA AGAATTAGAC TCGTCTAATA TACCTGAACA TATCGCTATT 3780 

ATTATGGATG GTAATGGGCG ATGGGCTAAG AAGCGAAAAA TGCCTAGAAT TAAAGGTCAT 384 0 

50 TACGAAGtAT GCAAACAATA AAAAAAATTA CTAGGGTAGC TAGTGATATT GGTGTTAAGT 3 900 

ACTTAACTTT ATACGCCTTT TCCACTGAAA ATTGGTCAAG ACCTGAAAGT GAAGTAAA 3958 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5333 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 170: 

10 





Al 1AAAALAA 


CTTAATATAC 


CTATTTATGG 


TGGTCCTTTA 


GCATTAGGTT 


TAATCCGTAA 


60 




TAAACTTGAA 


GAACATCATT 


TATTACGTAC 


TGCTAAACTA 


AATGAAATCA 


ATGAGGACAG 


120 


15 


TGTGATTAAA 


TCTAAGCACT 


TTACGATTTC 


TTTCTACTTA 


ACTACACATA 


GTATTCCTGA 


180 




AAC 11 ATGGC 


GTCATCGTAG 


ATACACCTGA 


AGGAAAAGTA 


GTTCATACCG 


GTGACTTTAA 


240 




ATTTGATTTT 


ACACCTGTAG 


GCAAACCAGC 


AAACATTGCT 


AAAATGGCTC 


AATTAGGCGA 


300 


20 


AGAAGGCGTT 


CTATGTTTAC 


TTTCAGACTC 


AACAAATTCA 


CTTGTGCCTG 


ATTTTACTTT 


360 




Jk. m n Jk Ik ^^^m 

AAGCGAACGT 


GAAGTTGGTC 


AAAACGTAGA 


TAAGATCTTC 


CGTAATTGTA 


AAGGTCGTAT 


420 




TATATTTGCT 


ACCTTCGCTT 


CTAATATTTA 


CCGAGTTCAA 


CAAGCAGTTG 


AAGCTGCTAT 


480 


25 


CAAAAATAAC 


CGTAAAATTG 


TTACGTTCGG 


TCGTTCGATG 


GAAAACAATA 




c> a. n 




1 A 1 VjviAACTT 


GG TT AT ATT A 


AAGCACCACC 


TGAAACATTT 


ATTGAACCTA 


ATAAAATTAA 


600 




TACCGTACCG 


AAGCATGAGT 


TATTGATACT 


ATGTACTGGT 


TCACAAGGTG 


AACCAATGGC 


660 


30 


AG CATTATCT 


AGAATTGCTA 


ATGGTACTCA 


TAAGCAAATT 


AAAATTATAC 


CTGAAGATAC 


720 




CGTTGTATTT 


AGTTCATCAC 


CTATCCCAGG 


TAATACAAAA 


AGTATTAACA 


GAACTATTAA 


780 


35 


TTCCTTGTAT 


AAAGCTGGTG 


CAGATGTTAT 


CCATAGCAAG 


ATTTCTAACA 


TCCATACTTC 


840 


AGGGCATGGT 


TCTCAAGGTG 


ATCAACAATT 


AATGCTTCGA 


TTAATCAAG C 


CGAAATATTT 


900 




CTTAeCTATT 


CATGGTGAAT 


ACCGTATGTT 


AAAAGCACAT 


GGTGAGACTG 


GTGTTGAATG 


960 


40 


CGGCGTTGAA 


GAAGATAATG 


TCTTCATCTT 


TGATATTGGA 


GATGTCTTAG 


CTTTAACACA 


1020 




CGATTCAGCA^ 


CGTAAAGCTG 


GTCGCATTCC 


ATCTGGTAAT 


GTACTTGTTG 


ATGGTAGTGG 


1080 




TATCGGTGAT ATCGGTAATG 


TTGTAATAAG 


AGACCGTAAG 


CTATTATCTG 


AAGAAGGTTT 


1140 


45 


AGTTAT CGTT 


GTTGTTAGTA 


TTGaTTTTAA 


TACAAATAAA 


TTACTTTCTG 


GTCCAGACAT 


1200 




TATTTCTCGA GGATTTGTAT ATATGAGGGA ATCAGGTCAA 


TTAATTTATG 


ATGCACAACG 


1260 




CAAAATCAAA 


ACTGATGTTA 


TTAGTAAGTT 


AAATCAAAAT 


AAAGATATTC 


AATGGCATCA 


1320 


50 


GATTAAATCT 


TCTATCATTG 


AAACATTACA 


ACCTTATTTA 


TTTGAAAAAA 


CAGCTAGAAA 


1380 




ACCAATGATT 


TTACCAGTCA 


TTATGAAGGT 


AAACGAACAA 


AAAGAATCAA 


ACAATAAATA 


1440 
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GCTTTTTCTT TATATATGAT GAGCTTGAGA 
TATATTGGCA GTAGTTGACT GAACGAAAAT 
TCAGGGGCCC CAACATAGAG AATTTCGAAA 
GTGGGCCCCA ACAAAGAGAA ATTGGATTCC 
GGACGACGAA ATAAATTTTG AGAAAATATC 
CAATATTTTT TTCAAAGCGA TTTAAATCAT 
CTATTTCTAA ATTAATATTT GGATTTGGTG 
CAATAATGTT AATTCCATAT TGTGCTCTTA 
TCTTTTCAGT TGCTTTCAAT TCTACAATAG 
GTACACTTGC ACTCGCAACA TTATGCGCAA 
CAACCGTATC TGCTCCAATT TTATTTAAAA 
CAGTTACTTT TTTTACACCT AACTCTTTTA 
TATTTTCACC AATTGCCACA ATGACATGAT 
CTGCTTCATC TGTAGTGTCT GCAACAACCG 
CTCTATTTTC ATCATGGTCG ATGGCCATTA 
CGATACTACC TCCAAAACGA CCTAGACCGA 
TCCATTAAAT GATTTTCATC AATTCATTGA 
TACCCCAACT AAATTATCTA AATGCAGTAA 
CAACTTATGA TTTCTTTCCT TCAACATATT 
ATATTAACGA TGGAAGTAAT AAAAGTAAAC 
CCACTTCTGG ATTAACATAT GCATCTGTAA 
ATTTACTAAT TCCATAGCCA AAGAACGCGA 
CCAAACCATG TTTTTTCTTA AAGAATGTTA 
TTATACCAAA CATCCACCAA TAGTCAAAAA 
TGCGTAATGA TAGAAATACG AATAAACAAA 
GCCATTGTCT TGTTAAATTA TATGCTGGTT 
AAAATCCTGA TGAAATATAT AAAACTGAAA 
ATGGGCTTAA TAATAACTGC ACCCAATCTA 
AGCCACCTTC TGTAATAGTT AAAGCAGTAG 



^ 0 786 519 A2 

CATAAATCAA TGTTCAATGC TCTACAAAGT 
GCGCTTGTAA CAAGCTTTTT TCAATTCTAG 
AGAAATTCTA CAGGCAATGC GAGTTGGGGT 
CAATTTCTAC AGACAATGTA AGTTGGGGTG 
ATTTCTGTCC CACTCCCGAT TATCTCGTCG 
TATCATGTCC AATCATGATT AAAATATCAC 
AAATGATGAA CTCTTTGCCT CGTTTAATTG 
TATCTAAATC AATGATAGAC TGCCCCGCCA 
AATGCTCGTC TGCCAACTCA AGATAATCAA 
TACGTCTACC CATATCACGC TCAGGGTGCA 
TCTTTGCATG ATAATCATTT TGTGCTTTAG 
AAATTAAAGT CGTCAACGTA CTTGATTGAA 
CAAAGTTACG GATACCTAAA CTTTTCATAA 
CATGAGTAGC GATATCACTA TATTCATTCA 
CATCCATGTC TAATGCATTC AACTCACGAA 
TGACTACATA TTCTTTACCC ATACTOGCCC 
AAATATAAAT TTAAAATTAT TATAAATGAG 
TGCAAGTAAA TGAAAGTTGG GGTATCGTCT 
CTTTGTCGAA AACAAATAAT CTTAATAATA 
CTAAAATAAA GACAATCACT AATGTCCAGC 
TTTTTACAAA CGGATATAAA AGGTATGGCA 
ACATCATTTG TAAAATAACA AATACAAAAG 
ACAATGAAGC TAATGCAAAG AATAAGAAAC 
CAGCTGAATA AAAATGTTCA GAATTTTGAA 
TGAT AAT CAT CGGCGGCCCT AAAAATATGT 
CGTCATTTGC TTTTTTAGCA TAATATGTCA 
TAATTGCCAA GAATACTACA GACCAAGCAA 
GATCGATAAC ATTGTTTCGA ACATTAATAT 
ATAATGAAGC TGGAATTAAT AATCCACTTA 
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AACTGTTTCT 


CAACGATATC 


ATAATCAGTG 


CTATTGAACC 


TGGTATTAAC 


AATACCGTG C 


3360 




CTAAATATTT 


GATTGACTCT 


GGAAAGAAAC 


CTACGAATCC 


TACGAAGAAG 


AAAACAAAGA 


3420 


5 


ATACATTCGT 


AACTTCCCAA 


ACTGGGTTTA 


AATAACGTGA 


AATTAAGTGA 


TTAATTTTCT 






TTTCATCACC 


AGTTAACTTT 


GAATGCAATG 


CGAAGAAACC 


TGCCCCAAAA 


TCTATAGAAG 


"> C A f\ 


10 


CAATAATGAT 


ATAGCAAAAT 


AAAAAGAACC 


ATAACACTGT 


TATACCTATA 


AA TGCAT A A A 


c t\ /\ 


TCATTTTTCT 


ATTTCTCCTC 


CTTGCTTCTT 


GGCTAAACGA 


TTTACATCTT 




"3 C C f\ 




TTTATriTTA 


AACATACGAA 


TTAATACGTA 


TGCACATGTA 


TACATTAAAA 






IS 


TATGCCAAAT 


AAAATTGTAA 


CGAaGGTTAT 


TCCGCCTGCT 


TGTGTTGCTG 








GCGCATATAA 


CCACGAACAA 


TCCAAGGCTG 


TCTACCCATC 


TCTGTTAAGA. 








TT CT AT AG CT 


AGCATTGAAG 


CTGGGCCTGT 


TAATAATATT 


CCATAAAGCA 




"3 Q rt f\ 


20 


AGTAGAAAAC 


TTTCTAAGCT 


TTTTAAACAT 


TAAAGTTAAG 


ACATAAACAC 


CTGAAATGAC 






AAAACATAAA ATTCCCATCG 


TTACCATTAA 


ATCAAAGAAA 


TAATGGACGA 


TCATAGGCGG 






ATGTAAACTT 


TTTGGAAAAT 


CATTTAACCC 


TTGTACTTTA CTTTTGACAC 


TATTATCTGC 


4080 


25 


TAAGAAACTC 


AATAGTCCAG 


GTAATTCAAT 


CGCACCTTTA 


ACTTGCTgJAG TCTTTTCATC 






TAACACACCA 


AATAATAATA 


ATTTGGCATG 


GGAAGATGTA 


TCGAAATGCC 


ATTCATAAGC 


A "5 f\ 




TGCTAATTTT 


TCAGGTTGGA 


ATTTATGCAA 


AAATTTTGCA 


GATAAATCCC 


CTGCCAACAT 


A *5 £ r\ 


30 


AGAAAGTAAT 


GTTGAAAAGA 


ATCCAACTAT 


CATAGACATT 


TTCAAAGCTT 


TCTTATGGTA 


4 J<£U 




GACAGTATCT 


TTAGGTTGAC 


GATTACGCAA 


TAATTTAAAA 


GCTGCTATTG 


ATGCAATAAC 


a y. o n 

^ J 0 u 


35 


AAATGCCATC 


GTCATACCGG 


CTGTAGTAAT 


TACGTGAAAT 


GATCGAACTA 


TAAACGATGG 


A A a n 


GTTAAACATC 


GCTTCTATAG 


GTTGAACATT 


GACCATCTTT 


CCATTCTTCA 


ACTCAAAACC 






TGCAGGCGTA 


TTCATAAATG 


AATTCACTGA 


AGTAATGAAG 


AATGCTGAGA 


AAGAGCCACC 


^* 3 V u 


40 


AATAATTACT 


GGTATACTAA 


TTAAGAAATG 


TGTCCATTTA 


TTTTTAAAAC 


GATCCCAAGT 


Aeon 




ATATAAATAT ATACTTAAGA AAATAGCTTC AAAGAAGAAC GCAAATGTTT 


CCATAAATAA 


4680 




TGGAAGTGCA ATAACGTGTC 


CACCCATTTC 


CATAAATGTA 


GGCCAAATCA 


ATGATAATTG 


4 74 0 


45 


AAGTCCTATA 


ATTGTACCTG 


TAACAACTCC 


CACTGCTACA 


GTAATTGTAT 


AAGCTTTAGC 


^* 0 \j \j 




CCATCTTTTG 


GCCATAGCTA 


TATATTGAAG 


ATCATTTTTG 


CGAATACCTA 


AAAATTCTGC 


4860 




AATTGCGAAC 


ATTAAAGGCA 


TACCAACACC 


AATCGTTGCA AAAATGATAT 


GAACTGCTAA 


4920 


SO 


AGTCATAGCT 


GTCAAAAACC 


GACTGATTTC 


AACTGTATCC 


ATTTAAAAAC 


ATCACCTTTT 


4980 




Tcrrn-nro 


ATGACAACAC 


AATGAACTTA 


ATTATAATTG 


CTATAATGTG 


TATTTTTAAA 


5040 
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GAATTTCAAT GTATAATTGT GTATATTACA TTAGAATAAA GCACGAAGGA GCATGATACA 5160 

TGTCAGAAAT AATCGTTTAT ACGCAGAATG ATTGTCCACC TTGTACATTT GTAAAAAATT 5220 

5 ATCTAAATGA GCATCACATT GATTTTGAAG AGAGAAATAT CAACAATCAA CAATATCGAA 5280 

ACGAAATGAT AGATTTTGAT GCTTTTTCAA CTCCGTTTAT TTTGTTGAAT GGC 5333 



(2) INFORMATION FOR SEQ ID NO: 171: 

10 (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 11126 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 171: 

TTAAAATATT ACTGCCATCG 60 

TTCCAAATTG AGACATACTT 120 

AATGTAAATC TCCTTCATCA 180 

TTAAACGTCG TTTTGCATGA 24 0 

GCGAAACTTC GCCGT CTTTA 300 

TTAAATTTGT TAAACCCATC 360 

CACGTTCCAT TGAAATATAG 4 20 

GCCCCATACC CGAACCAATT 4 80 

TTTTCCCTGc ATGTTGACCG 540 

CAGCCCATGG TTTGT AT CGA 600 

ATTCATAACT TCATTTAGGA 660 

TTCATACCAT TGAACAAGAC 720 . 

TAAATTCAAG CTCTCTTGAA 780 

AACATAGTTG TAAAGCAGCA 84 0 

CCAATCAACT AAAAATAGTT 900 

ACCATGTACA ACAGTGAAAA 960 

TAATGATTTT CTCACAATAT 102 0 

ATTAAGCATA ATCTCAGGAG 1080 

AGGTCTAGAA TTGTGTATCT 114 0 



2G 



35 



ATACGTGACC CTTTATCCGA AAATTTCTTT TCATATTCTG 
TCTTCTTGAT GTAAATTTAG ATTTATTTTT GTAAAATACA 
TCTAAACTGT AGGCAAATAG TCCTCTGTTA TCAGTTTTAA 
25 TTTAAGATTT GTTGATACAA CGCTAAAAAC GTATGATACG 

CGATTTTTTG GCCATGGATC TGAAAAGTTC AAATAAATAC 
AAATATTCAT TTAATTCAAT GGCGTCATTA CAAATAATCT 
30 TCTTTAACTT TATCCAATAC TTTATAAACG ATACTTTTCT 

TTAATATGAG GATTTTGAGC AGCTAATGTT GTAATAAACT 
TCAATGTGTA TCGGTTGCGT TTTaTCAAAC CATTCAGTCA 
TCCATGTCAA CCAATTCAGG ATGATCTTTT AAATAATCTT 
ACTCT CAT AT TTTATTCTCC TCTTAAATAA ACATGTTACT 
ATTTAAGCCA AGTGTTCATA TCCTTATATC TTTTTTGCTC 
CTATAGATTG AATTACCGTA TACCATTTCA TACGTTTATT 
CACCATATGT TTCAAGCCAT TCAGACCATT GTTGTTGTGG 
TTCCGATATC AATTGC CGGG TCTGCAATCA TTGCACCTTC 
CATCTCG AT C GGATAATAAC CAATTATTAT GATTCACATC 
AACGCGAATC TAAACTCGGT ATATGCTCTT CTAAATAGGT 
so GATGTGTTAA AACTTCTCTT GATAAAGAGG CATTAATTTT 
TAATAGGTTC CATTTCCATA CGCTTTAACA TACTTAATAA 
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TTTTCCAATG TTGTG CTGT A ACAACCTCGC CTGTTTCTAT GCGTTTCGTC CATACTAATT 
TGGGCACAAT ACCTTCTGCT GATAATGCCG CAATAAATGG ATTTGAATTT CGTTTTAAAA 
ACAACTTTTG TCCATCTTGT TCAGCCATAT ATGCTTCACC AGATGCACCA CCTGCTGAAT 
CAAGTGTCCA CCCTAATTGA TAAAACTGCT CCAACTCGTC CACCTCACTT TCAATTAGAA 
AATGGCTCTA GAAATAGGTT TTTCAAGAGC CATATATTCT AATTTATAAC ACCATACTGG 
TACAAATATT ATGTCCAGAT AATTATTGTA AATCCTCAAC CAATGCCTAC ATTACACGAC 
TAAATTTAAA TCGTAATGTC TGTCATTGAC ACCATACATT CTATAGTCAC TTACTTGACA 
TATAATGTTA CCGTGTCTAA AACTACATGT TTTTGAATCT CTGTAGG CGA TAAACTcTAG 1680 
TTTTCAAAAT AATTGCTATC CCATTTTCAT GGTTAGCATA AATTTATGAA CTGTAACATT 17 40 
TACGTACTTA GTAAAATATG ATGCACATCA TATTTGTrAC TCATAGAAAA TTTTATAAtT 
2Q TTTATCATTA TATTTCAACT GAAAATGAGA AACAAAATGG CACTTTTTAC TAATATGTGT 

TTTCTAAACA ACACTTTTAA GCTTCGTTTT AAATTATAAC ATAATTCACT TACGAAAGTT 
GATAAATTTA AGTAATTTAA TCTAAAAATA TGATGAAAGA ATTTTAAATA CTGTGTGACT 
CTATATACTT TTCAAATCCT TCTTGTAGTT GACGTGTAAT TGGGCCAACT TTACCATCAT 
TAACTGGTTC ACCATCTAAT TTAATAACAG GTGTAACCTC AGCTGAAGTA CTTGAAACAA 
T AACTTCAT C TGCGTTTTTC AAGAAATCTA CAGTAAACGT TTCTTCTTTA AATGGGATGT 2160 
TATAGTCTTC GGCAATTTTT TTAATTACAA TTCGTGTAAT ACCATTAAGA ATATAGTTGT 2220 
TAATCGGATG TGTATAAATC ACACCGTCTT T AATTG CAT A AG CATTACTT GAAGATCCTT 2280 
CAGTTACAGT TtCACCTCGA TGTTGAATTG CTTCAACTGC ATTATATTTC ACAGCATATT 2340 
CTTTTGCTAA TACATTcTCC TAATAAGTTC AAGCTTTTAA TGTCGCAACG TAACCATCGG 2400 
ATATCTTCAA CGGTAACACC ATTCACACCA TTTTCTAAAT GATCATAAGG ACGATCATAA 2460 
CTCTTTGTAT AAGCAACAAT TGCTGGTTCT ACTTCAGGTG TCGGGAAGCT ATGATTCCTT 2520 



1800 
1860 
1920 
1980 
2 040 
2100 



TCAGCTACAC GACGCGTTGC TyGAATATAA ATTGCCCCAG TTTCAATTTG ATTCATATCA 2580 

ACTAATTTAC GAGATAGTTC AATTAATTCT TCTACAGAAT AATTTAAATC TAAACCAATC 2640 

45 TCATTGGCAC TACGTwAAAw TCTTTCATAA TGTTCTGTTA CTGTAAATAA CTTACCATTA 2700 

TATACTCGAA TGTATT CAT A AATACCATCG CCAAATACGT ATCCTCTGTC GTTGTATGAA 2760 

ACCTTTGCTT CACTTGGACT TACAAACTCA CCATTTAAAA AAATTTTTTC CATATATTAT 2820 

TCCTCCACGC ATAATGAATA AATTG CTTCT AAGTAAATAC TAGTTGCGTT AAATAACTGT 2680 

TTTTTAGTGA TATATTCATT TTTCTGATGC ATTAAATCTT CAGAATCACT AAACATTGCG 294 0 
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TCAGTCATAT CATTTGTTTG ATTTCTATAT GCAGTAACTA ACTTTTGTAC AAAAGGATCA 3 060 

TTTTTATCAA CATAATGTGG TGGTTGGACT TTAC CTAATT TCACTTCAAA GCCATATTGT 3120 

TGAATCTCAT TTGCAAAACG ATCCATAGCT TTTTCAAATT CAAATCCTTC TGGGTAGCGT 3180 

AAGTTGATAC CGAAAAGACC TGCGTTTTCA TTATCATATG TAATAACACC AATGTTAGTT 324 0 

GTCACGTCAC CCATGACATC TGTATGGAAT TTCATTCCCA TCTTTTCACC AAAATCTGAA 3 300 

TTAAATAAGT AG CGATT ACT AAATGCTACA AACGCTTGTG CATTATTATC AAGATTTAAT 3360 

GATGCTAAGA ATTTTAGTAA GTAAAGACCC GCATTCACAC CGATAGATGG ATCCATACCA 3420 

TGAACCGCTT TACCTTCAAC TGTTAAAACT AGAATGCCAC TAT CAACAGT ACTATCACCT 3480 

TGTAAATGAT TTTGTTCTAA AAAGTACTCA AAGTCTTGAA TAACATCTGT CATATTTTCT 354 0 

TTAACAAGCA CTCTTGCTTC TGCATGATCA GGTACCATGT TGTAACGTTC ACCAGATTTA 3600 

AAAGTTATTA ATTCATAATC AGGTTCATCT TGATCTTCAG TAAGTTTATT TTGAACTAAA 3660 

TCAAATGTTG TAATGCCTTT TTCACCATGA ATACATGGAA ATTCTGCATC TGGTGCAAAA 3720 

CCTAATGTTG GCATTTCTTC TGTTTTAAAA TAGCGATCCG TACATTTCCA ATCAGATTCT 3780 

25 TCATCCGTAC CAATAATCAT ATGAATACGT TTCTTCCAAT CCACATTCAT ATCTTCTAAT 3 84 0 

ATCTTAATTG CATAATAAGC AGCAATTGTT GGACCTTTGT CATCAAGTGT ACCTCTAGCT 3 900 

ATGATAGCAT CTTCTGTTAC AACCGGCTCG AACGGATTAC TATCCCATCC ATCACCAGCA 3 960 

GGAACAACGT CAACATGACA TAAGATACCT AATACGTCAT TTCCTTTACC TGCCTCAATT 4 020 

CTTCCTGCAA TATGATCCAC ATCATGTGTT GTAAATCCAT CTCTATGTGC AATTT CAT AC 4 080 

ATGTAGTCTA ATGCCTTACG AGGACCTGGA CCAACTGGTG CGTCTTCTGA TGCTTTTGCA 414 0 

TCATCTCTCA CACTTTCAAT TGCTAATAAT CCTTTTAAGT CATTAATGAT TTGATCTTCG 4200 

TATTGTTGAA CmmTH CCACATTCGA AATCGACTTC CTTTTTTCTA TAAGTTAAAT 4260 

TCTATTTTAC ATGAAAAGAT ATAAAAACTA CAATAAGATG TCAGAAAATA ATAAAAAGGA 4320 

ACAAAACGAT GCTATTGATA TGACACAAAT CATAAATAGC TGCTTTGTTC CTTTTTTAAT 4 380 

TTATATATTT AAAATACACA TATTCAAGAG CTCGAGATAT AAGTCAATGT ACTAGGCACA 444 0 

45 CAATTTAATA TTGACAGTAA TTAACCGAAC GAAAATGCGC CCCGGGGCCC CAACATAGAG 4 500 

AATTTCGAAA AGAAATTCTA CAGACAATGC AAGTTGGCGG GGCCCCAACA TAGAAGCTOG 4560 

C CAATAGTT A GCTTTCAATA ATGTGCAAGT TGGGGTAAGG GCCCCAACAC AGAAG CTGGC 4 620 

50 CAATAGTCAG CTTTCAATAA TGTGCAAGTT GGGGTAAGGG CCCCAACACA GAGAATTTCG 4680 

AAAAGAAATT CTACAGACAA TGCAAGTTGG CGGGGCCCCA ACACAGAAGC TGGCCAATAG 4 74 0 
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TAAAGAAATA 


CGTTTTCTTT 


AGATATTAGT 


ATTT CTTATG 


AATGAGTTTC 


ACGCATGTAT 


4 ft fin 

T o o u 




TCTTCTTTCT 


ATATGCATAT 


TAGCTATGAC 


TAACGATAAA 


GAACCTGAAA 


CACTAATAAA 




5 


TGTCCTATAG 


TTTACAATAT 


TATATTGGCA 


GTAGTTGACT 


GAATGAAAAT 


ACGCTTGTAA 


4 980 




CAAGCTTTTT 


TCAATTCTAG 


TCAACCTTGC 


CGGGGTGGGA 


CGACGAAATA 


AATTTTGCTA 


504 0 


10 


AAATATGATT 


TCTGTCCCAC 


TCCCTTATCA 


TTTCTGTCCT 


ACTCACATCT 


TATT CTTTAT 


5100 


CAGATAATGC 


ATTTTTATTC 


TTTTTTAAAT 


CTTCTTCAGT 


GACGATACGT 


AAATTATTAT 


5160 




TTGGTGTGCG 


CCACCTTCAT 


CATCAAATTT 


ACCTTTTTCA 


ATACTTTCGT 


CAGT CTTATT 


5220 


15 


GTCATATTCG 


GTAAATTTTG 


ATTTTTCTTC 


TTTGAAAAAT 


GCTTTTGGAT 


TATTTTTTAA 


5280 


TCTATTAGCA 


TATTCTTTCG 


GATTTGTTTT 


TACTTCTTTA 


ATTGTTTCAT 


TAGCAATTGT 


5340 




TCCTAATTGC 


GTCGCTTTAT 


CCTTAGCATT 


ATCTTTATAG 


CTTTGAGGAT 


CTTGTTTATA 


5400 


20 


TTTATTATAT 


TCcTGcTTTC 


AGCTTGTCAC 


GACTATCTTT 


ACGTGTAACA 


AGTACAGCTG 


54 60 




CTACAGCGCC 


AC CTATACCT 


AAAATCGCTT 


TAAATAAATT 


ACCTTTTGCC 


ATATCAATCG 


5520 




TCTCCCTTTT 


ATTTATAATT 


TAATTTGTCA 


AAATCATTTT 


CAGTTAATAA 


ACGATATTCT 


5580 


25 


CCTGAATCTA 


AATTGCTGTC 


CAATTCTAAA 


TCAGCAATTT 


TG ATACGTCT 


TAAATGTAAT 


5640 




ACCTCATTTT 


GAATGCTATG 


AAACATTCGT 


TTAACTTGAT 


GATATTTTCC 


TTCATAAATT 


5700 




GTTACGTGTG 


ACGTTTGATT 


ATCAATATAA 


GTTAATATTG 


CAGGCTTAAC 


CTTGCCATCA 


5760 


30 


GTCAGTGTtA 


CACCCTCTTT 


AAAAGCTTGA 


ATGTCGTCTT 


CAGTGATAGG 


ATTTGCTGAA 


5820 




ATAACTTCAT 


ATTTFITAGA 


AACATGTTTG 


TTTGGACTCA 


TTAATTCATG 


ATTAAAATCA 


5880 


35 


CCATCATTCG 


TTATCAATAA 


AAGCCCTTCT 


GTATCTTTAT 


CAAGACGACC 


AACCGGAAAA 


5940 


ATATTTAGAT 


GTTGGTATTC 


AGGTATTAAA 


TCAATAACGG 


TTTTTGAATG 


ATGATCTTCA 


6000 




GTTGCTGATA 


TATAACCTTT 


TGGCTTATTT 


AACATAATAT 


AGACATTTTC 


AATGTATTCT 


6060 


40 


ATTAATTCTC 


CACGAACTGT 


TATCTTATCG 


TTTTCTGGTT 


CTATATGTGT 


TTTTGGTGAT 


6120 




TTAATTACTT 


"GTTCGTTGAC ATTTACAAGG CCTTTTTTAA GTAACTGTTT 


GACCTCATTA 


6180 




CGTGTACCGA 


CGCCCATATT 


TGCTAAAAAT 


TTATCTATTC 


TCATCGTAAA 


AACCTAACTC 


6240 




TACGTCTTAA 


TTTTTCAGGA 


ATTTCACCTA 


AGAATTCGTC 


CGCAAGACGC 


GTTTTAATTG 


6300 




TGATTGTACC 


GTAAATTAGA 


ATACCTACTG 


TAACACCTAA 


AATAATAATG 


ATTAAGTAAC 


6360 




CAAGTTTAGT 


AGGTTCTAAG 


AATAGATTTG 


CAAGGAAAAA 


TACTAATTCT 


ACACCTAGCA 


6420 


50 


TCATAATAAA 


TGAATACAAG 


AATATTTTTG 


CAAAATGAAT 


CCAACTATAG 


CTGAATTTAA 


6480 




ACTTCGCATA 


rrrrrrAAGA 


ATATAGAAAT 


TACATCCAAT 


TGCAAATAAT 


AATG CGAT AC 


6540 
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ACTTGATAAC TACAGAAGCT AAAATAACAT AAACTGTTAA TTTCTGTTTA TCTATAC CTT €660 

GTAACATTGA TGCCGTTACA CTTAATAGTG AAATTAGTAT TGCTACAGGC GCATAATAGA 6720 

ATAATAAGCG ACT AC CAT CA TGGTTAGGGT CATGACCTAA AACAATTGGA TCGT AAC CAT 6780 

AGAAAACTGT GAATAATGGT TGTGCGAAGG CCATAATTCC AATACTAGCT GGAACAGTTA 6 840 

TAAACATTAA TACACCAATA GATGTTCTAA TTTGATGATG CATTTCATGT AAGCGACCTT 6 900 

CTGCAAATGT TTTTGTAATA TAAGGAATTA AACTCACTGC AAAACCAGCA CTTAATGATG 6 96 0 

TCGGAATCAT TACAATTTTA TTAGTTGACA T ATTT AG CAT ATTAAAGAAT ATATCTTGTA 7020 

ACTGTGAAGG TATACCAACT AAAGATAAAG CACCGTTATG TGTAAATTGA TCTACTAAGT 70 80 

TAAATAATGG ATAATTCAAA CTTACAATAA CGAACGGTAT ACTATAAGCA ATAATTTCTT 7140 

TATACATCTT GCCATATGAC ACATCTATAT CTGTGTAATC AGATTCGACC ATACGATCAA 7200 

T ATT ATG CTT ACGCTTTCTC CAGTAATACC AGAGTGTGaA TATACCAATA ATCGCACCAA 7260 

CTGCTGCTGC AAAAGTAGCA AT AC CATTGG CTAATAAAAT AGAGCCATCA AAGACATTTA 7320 

GTACTAAATA ACTTCCGATT AATATGAAAA TCACGCGTGC AATTTGCTCA GTTACTTCTG 73 80 

25 ACACTGCTGT TGGCCCCATA GATTTATAAC CTTGGAATAT CCCTCTCCAT GTCGCTAATA 744 0 

CAGGAATAAA GATAACAACC ATACTAATGA TTCTTATAAT CCAAGTAATA TCATCGACTG 7 500 

AC CAAC CGTT TTTATCATGA ATGTTTCTAG CTAATGTTAA TTCAGAAATA TAAGGTGCTA 7560 

30 AGAAATACAG T AC CAAG AAA CCTAAAACAC CGGTAATACT CATTACAATA AAACTCGATT 7620 

TATAAAATTT CTGACTTACT TTATATGCCC CAATAGCATT ATATTTCGCA ACATATTTCG 76 80 

AAGCTGCTAA TGGTACACCT GCTGTCGCAA CTGCAATTGC AATATTATAT GGTGCATAAG 774 0 

CGTATGTGAA CGGCGCCATA TTTTCTTGTC CACCAATTAA ATAGTTGAAT GGAATGATaA 7800 

AAACTACGCC CAATACCTTG GTAATTAATA TACTAATGGT AATTAAAAAG GTTCCACGCA 7860 

CCATTTCTTT ACTTTCACTC ATTACGAATC TCCCTATCTC ATGTTTATTA AAGTTTTGTA 7 920 

AACTAAAAGC TGTTTCTCTG TAAAATCATT TTTCATTATT ATGAATATAT CACAAAACTT 7 980 

TATTTCATTG TCGTATATTC AATGAATTAT CATAACAAAA TTATCAACAC ATTGTCATTG 804 0 

AATACTAGAT TTTGATTAGA ATATTACGAA ATTTCATATA AACATTATAC TACTATTTGA 8100 

GATGAACATC GCATAACAGT AGAAAAATCA TT CTT AT CAT ACACATACAT CTTCATTTTT 8160 

TATGAAGTTC ACATTATAAA TATATTCAAC ATAATTGTCA TCTCATAACA CAAGAGATAT 8220 

SO AGCAAAGTTT AAAAAAGTAC TATAAAATAG CAATTGAATG TCCAGTAACA AATTTGGAGG 8280 

AAGCGTATAT GTATCAAACA ATTATTATCG GAGGCGGACC TAGCGGCTTA ATGGCGGCAG 834 0 
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GTAAACTCAA 
AAATTATTAA 
ATAATGAATC 
ACGGGCGTAT 
CTATCGAACG 
ATACAGACCA 
TGATTGCTAC 
TCGCACAAGA 
CAGCTGAACC 
TGTCAGTACT 
CTCATTTTGG 
AAAAAAATCA 
ATGAACAATT 
AAAACAGTTT 
GAATCGATGA 
ATATGTTTAA 
TCACAGGTGG 
TTCCGGGATT 
ATATTACAAG 
ATGCATCAAT 
TCATTCAAAT 
GTCATTTCGT 
CACCTGTAAT 
GAAGTTCTTT 
CTTTTGGAGC 
TTGCTAAAAT 
CTTCATCAAT 
CTAATTGTTC 
CAATTCGCAG 



AATATCTGGT 
GAACATTCCT 
CATCATAGAT 
GTTTCCAGTT 
CCAACATGTA 
AACTTTCACT 
AGGTGGTACA 
TTTAGGTCAT 
TTTCATCAAA 
TAAGAAAAAT 
TATCAGTGGT 
AAAGACACAG 
AAAACAACAC 
GCATGGTCTA 
AAATACCACA 
AGGGTTTGTA 
TGGTGTGTCA 
ATTTTTATGT 
TGCACTCGTA 
GGAATAATAG 
AAAAATGACC 
TAATTATGAT 
CAGTGCAAAT 
TTCAACTTTG 
TGGCTGAATT 
TTCATCAACA 
CATTCTATTG 
TGGTGTTGCG 
TAAGCTATTT 



GGCGGTAGAT 
GGaAATGGGA 
TTTTTTGAGT 
TCCAACAAAG 
ACGATTAAAG 
GTACATACTC 
AGTGTCCCTC 
ACCATTACTG 
TCCAATCGTC 
GGTAAAAAAC 
CCAGCTGCAT 
CACATTTCTA 
ATCACATCAT 
ATTGAAGAGC 
TCACATCACT 
TTTAAGGTGA 
CTTAAAGAAA 
GGTGAAGTAT 
ACAGGACATG 
TATAAAATTT 
TTAATATAAC 
TCTTTTTCGT 
TCTTTCAATG 
CGCGATTCAT 
TCTTTTGGTG 
ATGAATTGCG 
CCATCTGCAA 
ATCGCTTTGA 
TCTTTTTCAG 



GTAACGTAAC 
AATTTTTATA 
CTAGGGGTGT 
CACAAGACGT 
AAGAAGAAGC 
AAAATAATAG 
AAACTGGTTC 
AGTTATTCCC 
TAAAAGGTTT 
GCATCAGTCA 
TAAGATGTAG 
TGGCAATCGA 
TATTATCGGA 
GCTACTTACT 
TATCAAATCA 
ACGGGACATT 
TTCAACCTAA 
TAGATATACA 
TCGCTGGATT 
GGTTCGATTC 
TGAGTCACTA 
TTTTAGTACG 
GTAAATCCAT 
GTGTCTCTTC 
ATACTTTCGT 
TGTGTTGTTT 
CATATTGATC 
ATTTCG CATA 
TAATTACTGC 



TAATCGATTA 
TAGTC CCTTT 
TAAATTAAAA 
GGTTGATACA 
TGTTAGTAGA 
TTATGAAAGC 
AACTGGTGAT 
GACCGAAGTT 
AAGTTTAAAA 
TCAAATGGAT 
TCAGTTTGTT 
TGCATTTCCT 
CACACCAGAT 
GTTCATGCTG 
ACAATTGAAC 
ACCTATAGAT 
AACAATGATG 
TGGTTATACT 
ATATGCCGGA 
TCTTTAGTAG 
AAAAGTGTCG 
TCTTCTAGCT 
TCCTTCAGAA 
TTTTTTAATA 
CGCTTCAGCT 
GATGTCATTT 
AATTAATACT 
TGTTTGTTGA 
TTCTATATCG 



CCATATG CTG 
TCAATTTTTG 
GAAGAAGATC 
TTAGTGACAA 
ATCGAAGTTA 
CATTCGCTAG 
GGTTATAAGT 
CCAATTACAT 
GATGTTGAAT 
ATGTTATTTA 
TATAAAGAAC 
GAATTAAACC 
AAAATCATTA 
GAACAAGCAG 
GACTTAGTAA 
AAGGCATTTG 
TCTAAATTAG 
GGTGGTTATA 
CATTACTCAC 
ATCAACTTTT 
TTATATTAAG 
AACAAAGCCG 
CCTGTATTTG 
GGCGTACAAA 
GGTAATTTAA 
AATGTCGCAT 
TTTACTTTAG 
GCAATGTTAT 
CTTAATGCAA 



B460 
B520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
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CATCCATTTG TAATTTTAAA GCAGTTATAG CTTTTAATGC ATCAGCCTTA TTACGATTAC 10260 

TTACTTTTCG ATAATTTTGC ACTAAAGCAG TGACGCGTGC AAGATCATCA TTAATCGTTT 10320 

TTTCAGCATC TGGCTTTTTA ATAGGATGTA CATCTAAATC ATGTATTGTT TGTAGATTTA 10380 

ATGATG CTGT TTTATCAACT TGTGCATTGC TACGATCTTG ATCAATTTGT CCAATAGCAG 10440 

TGTCATAAAT ATTTTGTAAC TGTGCTAATA TACTATTTCT TTCTTCTACC GTTGCTTGAA 10500 

TATTCGCTTC AATTGCTTGT TTTTTATCGT TGAATAATGT TGTCAATTGT TCTCGAGCAG 10560 

ACGCCTTTCT GTTAATAACA GGTTCGATTT CACGAATTTC GTTTTTCTCA TCATGCAATA 10620 

AATATGCCAC ATCTGCATTA GTCACTGCAC TAGCAATTTG TTGTTTAGCT TTAATTAACT 10680 

CTTTTTCAAC TTGTGCTATT GCAATATTTT GTTCTTCATC TGTCGCTTCG TTATTTGCTT 10740 

TAATTAAATT AATTTTATTT GTAGCGATAT TTTGAATTTG TTGTAATGCT GTTGCTTTAA 10800 

CTGTTGTCGC TGGTTTAATT TTTGAAATAA TATTTTGAGC ATTTATACTA TCTTGATTAA 108 60 

CTTGGGCAGT CTTATCTGCA TGATTGATCT GATCAATAGC CTGATTAAGT GCTTGTTCTA 10 920 

CTAAATGTTT AGCAGCTAGT CTTTCTTCTT CAGTTGATAA ATCGCTTTGA TCGATTAGTG . 10 980 

25 CATTTTGAGC TTCGGCTTTT ACACCAACAG ATTGACGCGC TGCTGGTTTA ACTTGAACTT 11040 

TAGGTAAAAT CACTTTGATG TTGTCGTTGC CATCAGTCnC AGTnCGATCC ACTTCTGCAT 11100 

TCGTTTTGTT TTGTGCAATG TCATTT 11126 
30 (2) INFORMATION FOR SEQ ID NO: 172: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3660 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



20 



40 



45 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 172: 

TTGCCCCGCA CGGCGGTGTG nTTCCTAGAA ATAATGAATA TAAAGaGAAA TATATAACAA 60 

CGATTTTGAA TTATGAACCT GGTGATATCG TTACAATCAA ACGTGTGAGA GATAAGACCG 120 

ATTTGCTAAT ATATTTGTCT AGTAAAGATA TTTCTATTGG TAATGAAGTG GAAATTGTAT 180 

CGAAAGATGA AATGAATAAA GTAATTATCA TTAAACGTAA TGATAATGTA ATTATTGTCA 24 0 

GTTACGAAAA TGCAATGAAC ATGTTTGCTG AAAAATAAAA TAAAGAAGCC ATAAAGATAT 300 

50 CCATGATTGA ACTGATAAAG ACATATGGAT AATTGCTTTA GGCTTCTTTT TTATTAGTTA 360 

ATTTATCAAG TGAGTATATT TGAGTAAAAT ATTCACTGCA TAAAGATTGA AGATAATCCA 420 
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CTGTGGACTC 


GGACGCTGGA 


AAGTCAATTT 


AGCAATCGTC 


CAACTAGATT 


GTAGAACTTC 


540 




GCCTAATAAT 


ACACCTAAAA 


TATATTGATA 


ACTCATTGTG 


ACAAGTAGTT 


GAATTTCTAC 


600 


5 


TATATTTTCA 


TCrriTAATA 


TAAAATACAA 


CATGATAGAA 


ATTAAAGTTA 


TAACAACAAT 


660 




GGGTGAGCCT 


TTTCtAGATG 


TTAAAATTAA 


AAAATAAATA 


AATATCAATA 


AATAGGTAAA 


720 


10 


TATAAAGAAA 


CTAGGTATCT 4 GATAATGGCT 


CGACGCTAAA 


CCTATCAATA 


ACATAATAGG 


780 


TGGCATAAAA 


TAACCACCAA 


TCGTTGTAAG 


CCATTGGCCT 


GCTAGATGTC 


TAGATTGTGT 


840 




AATTGCGAAT 


CCTTGTTGTA 


ATGTCTGTTG 


TCGCTCTCGT 


GGACTTGTTA 


CAATGACTAA 


900 


15 


ATCTTTTGCA 


CGGCCACCAG 


CGAGTTTATT 


AAACAGTACA 


TGACCAAATT 


CATGTGTTAA 


960 




AACAGGGATA 


TAGTTTAAAA 


TGACATCTAA 


ATAGTTCAAA 


ACAGGCTTAT 


GTCTATATTG 


1020 




ATGAATAGCA 


ATATAACAAG 


CTGCAACAAT 


AACGATAATG 


TATATATTAA 


GTTGAATTGT 


1080 


20 


CGTATTAAAA 


AAGTTTGATA 


AATAATTCAT 


TGTTAACCTC 


ATATAAGATA 


TTAATTTAAA 


1140 




GTTTGCTTAT 


CACTTATTAT 


AAATGATATT 


GGCATCAATA 


GCGTTAGACT 


TTAGACTTAC 


1200 




CTTAGTTAAA 


CTAATTTTAA 


TTTTTGAAAA 


GGTGAATATG 


TGTTAAAATA 


AAGCAAAATC 


1260 


25 


ATTTCGATAT 


AAATAGGATG 


AATATAAATA 


CTGTTAATAT 


TGATTACACT AACATAATAA 
• 


1320 




TGAAATAAGA 


TAGGAGATTC 


CTGTTATGAC 


TGTTGAAGAA 


AGATCCAATA 


CAGCCAAAGT 


1380 


30 


TGACATTTTA 


GGGGTCGATT 


TTGATAATAC 


AACAATGTTG 


CAAATGGTTG 


AAAATATTAA 


1440 


aacctttttt 


GCAAATCAAT 


CAACGAATAA 


TCTTTTTATA 


GTAACAGCCA 


ACCCTGAAAT 


1500 




AGTGAATTAC 


GCGACGACAC 


ATCAAGCGTA 


TTTAGAGTTA 


AT AAAT CAAG 


CGAGCTATAT 


1560 


35 


TGTTGCTGAT 


GGGACAGGAG 


TAGTCAAAGC 


TTCGCATCGT 


TTAAAGCAAC 


CTCTAGCGCA 


1620 


TCGTATACCT 


GGTATTGAGT 


TGATGGATGA 


ATGTTTGAAA 


ATTGCTCATG 


TAAATCATCA 


1680 




AAAAGTATTT 


TTGCTAGGGG 


CAACTAATGA 


AGTTGTAGAA 


GCGGCACAAT 


ATGCATTGCA 


1740 


40 


AGAAAGATAT 


CCAAACATAT 


CGTTTGCACA 


TCATCACGGT 


TATATTGATT 


TAGAAGATGA 


1800 




GACAGTAGTG 


AAcGnAnTTA 


AACTGTTTAA 


ACCTGATTAC 


ATATTTGTAG 


GTATGGGATT 


1860 




CCCTAAACAA 


GAAGAATGGA 


TTATGACACA 


TGAAAACCAA 


TTTGAATCTA 


CAGTGATGAT 


1920 


45 


GGGCGTAGGT 


GGTTCTCTTG 


AAGTATTTGC 


TGGGGCTAAA 


AAGAGAGCGC 


CTTATATCTT 


1980 




TAGAAAATTA 


AACATTGAAT 


GGATATATAG 


/vjs— r\l Innin 


GATTGGAAAC 


GTATTGGTAG 


2040 




ATTAAAGAGT 


ATTCCAATAT 


TTATGTATAA 


AATAGCCAAA 


GCaAAAAGAA 


AAATAAAAAA 


2100 


SO 


GGCGAAATAA 


TCATGATGAC 


AAAAATAAAA 


CCGAGGAAAT 


CCTTAAATGG 


AGATTCTCGG 


2160 






TTATTTAATA 


ACGAAGCGGG 


ACTCATCGAG 


TTTGTTTCTA 


AATTCTTTTT 


2220 
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w 



is 



20 



25 



30 



35 



40 



45 



SO 



CATCAAGTTC ACCGTAATCT TTTAACTTTC CGCCTTCAAT 
ATTGTCTCAC TTGTCCTAAG TTATGACTAA CGAAAAAGAT 
ACTCGTAAAT TTTATCTAAA CATTTTTGTG CAAAAGTTTG 
CGTCAATGAC TAAGATATCT GGATTAACTG TGATATTAAT 
GCATACCACT TGAATACTTT TTAACTGGTT GATAAATAAA 
CAATAATCTT AGGTGTCATC GCTTTAATTT CTTTTCGCTT 
TAAATTCGAT ATTTTCAATC CCTGTAAGTT GTCCACTCAA 
CGCTGACTTC ACCATTACGA TCCACTTTGC CAACAGTAGG 
TATTGCTCAA CGTTGATTTG CCGGAACCAT TGATGCCAAC 
CATATGCTTT TAAACTAATG TCATCTAAAG CGAAAAATGT 
TGAGCGCATC TTTCATACGT TCTTTATTTG TACGATAAAT 
TTTTAATGTT TACCGAAACG TTCATTTGTA GACCTTCCTT 
TAATATACTA CTCAACAGTT GTTAAATTTT AAAACCTGTT 
TGTTATTATC AGAGTGGGTG TTTTGACACA AAATGTTAAT 
TTTAAAAACT AAACTTATTT CAACTTACAT GATTGTATAC 
CTAATATTTT AAAGAACTAG ACAATAATTT TG AT AG CATC 
ACAACAATTA TTATAATACT ATTTAGTTAA GTAGAGAAAT 
GGTTTAATGG AATGTCAGCA ATAGGAACAG TTTTTAAAGA 
TAATTCAAAG ACTGGCTCAG TTTCAAGTTA AAATTATCAA 
TGGCTTGGGA ATTAATTAAC CCTGTTATGC AAATTATGGT 
TAGG&ATAAG AAGTAATGCA CCAATTCATG GTGTACCTTT 
GTAT CAGTAT GTGGTTCTTC ATCAACCAAG GTATTTTAGA 
AAAAGTTTAA TCAAGTATCG AAAATGAAcT TCCCGTTATC 
(2) INFORMATION FOR SEQ ID NO: 173: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13668 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 173: 



CCAAGCAATC 

GGTTTTGTTT 

GTCACCTACA 

TGAAAAACCA 

CTCACCAAGT 

AAAGCCCATA 

GCCAGCACTA 

CGACAAAGAA 

AAGCCCTATG 

TTTGTTTTTA 

ACGATATTCT 

ATTCACATTT 

GTAAAGTGTA 
• 

CATCAATGAT 
TATAATGTAT 
CATGTATAGT 
AGTTAAACAT 
ACATGTAAAG 
TCATAGTAAC 
TTACTGGATG 
TGTTTATTGG 
AGGTACTAAA 
GATAtACCGA 



TTAGTACAAA 
TGCTCTTTAA 
GATAAAGCTT 
AGTTTTG CAC 
TCACTAAATT 
CATAACATTT 
ATTGCGATAA 
CCGCCAATGA 
ACGTCACCTT 
TGTTTGGGAA 
TTTGTTACAT 
ATCTAGATTA 
TAGAAGATTT 
AACAATGATA 
TTGTAATAAA 
GATAGTATTT 
TTGAAAGTGT 
AACTTTTATT 
TATTTAGGTG 
GTTTTTGGAT 
TTATTGGTTG 
GCAATTACAC 
CATATATTGT 



2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 - 

3420 

3480 

3540 

3600 

3660 
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ATTAATCACT TGTTGTGTAG AGTCTTGTCC GTTTTGGTTA TGATTGTTAG CCATGATATA 120 

CCTCCCTTAC AACACTCGTG GACCAGAAGT TTTCTGATCT CTCACATTAA CTTCTAACTT 180 

5 ACGTACTGGC ATTTCTGTGA AATATTCTAC ATTCTTTTTA ATATCCGAAC GAATTGCTTC 24 0 

AGTTAAAGAT TGAACTTGAA CATTATTTGG TACGAAAAAG TCAGTTTTAA TGTCGATATA 3 00 

AGATTTATTT TTTTTGTTAT ATAGTTTCGC AACTACATTT GGTTGTCTTA CTTGATCATA 360 

10 

TTTTGCAACC GT AT CGAATG CCGTCTTTTC AACAGCTTTA CGAGATACGT AAACATGACC 420 

AT CATCGAAG T CTTTGT AT A AT CCAGGTTT TCGATGCGTA GGTTTGAAGA TACTAAATAC 480 

TAATATAAGA CCTATTAATA TCAATAGTGC AGCAAGTGAA ATAAGTAATG GTTGGAACCA 540 

75 

TTCAAATTGA AGGAAGTAGT CTTGATATTC AGTTATACGT CCATCTTGGA TATACATGAA 600 

TAACAGGAAC CCCACGaTTA CTACTATTAA TAAGC CAAGG ATAAAGTTTT TAAGTCGTTT 660 

20 CACCCCTAAC GACACCTCCT TAGTTAAAGT TAATTTAAAA A CAT ATT AAA T ATGTAC CCA 720 

TCAGTTTTTT TCTTAAACAT AATAAATTAA TAACTTTAAA TTTATTTTTA ATATATAAGA 780 

TGAAGTACCA TTTAGTAATA TATTCCCTAG TTTTTGTAAA TAAAACCTCA TTATTAATTA 840. 

25 ATTyTCGTCA ATATGTTTTG AAGAACGATA TTCTAAAATA TCTGGGTCAC GATGTTTAAT 900 

TAAAACCTTA TTACTATTTC TCGGTTTCTC CTCACTCAAA GATTTTATAA GCGACCATAT 960 

CAT CG CT ATA ATGACCACGG AAAATGGTAA CGCAGCAATG ATTAATAAAT TTTGAATTGC 1020 

30 TTGAGTACCA CCTGTGTAAA TCATGATGAT TGCAAATAAT GCCATAATGA TACCCCAACT 1080 

CACTTTGACA AATGACTTCG GATTAATATC ACCACTTGAA CTCAACATAC CTAAAACATA 1140 

AGTTGCCGAA TCCGCTGATG TAACAAAGAA AATCATAATA ACAAGTAAAG TAATTAAGCT 1200 

3S 

TAATACAAAA CCTAGCGGAT AATGTTGTAG CGTCGCAAAA GTTGCTGTTT CTGTCGCAGC 1260 

TTTASCAATA TCGGCAATAT GATTATCTTG TAAGTAAATT GCTGACGCGC CGAATACCGC 1320 

AAAGAATATA AAGCAAACTA ACGCCGGGAC AAAAAGTACA CCTAGAATAA ATTCTTTAAT 13 80 

40 

CGTACGTCCT TTTGACACAC GTGCAATAAA TATACCTACA AATGGTGCCC AAGATATCCA 144 0 

CCATGCCCAG TAAAAGATTG TCCAATTTTG TAACCATTGG AATTTTTGAC CACCTGTCGG 1500 

45 AATGCGTAAA CTCATACTAA AGAAATTTGC AATATAATTA CCTAGAC CAT TCGTAAATGT 1560 

ATTTAAAATG TATAGCGTTG GCCCAACAAT AAAAAGACCA ATAAGTACTA CAAAAGCAAG 1620 

TAACATGTTG ATATTACTCA ACGTTTTGAT ACCTTTATCG AT ACCTGAC C ATGCTGACCA 1680 

50 AGTAAATAAT ATGGTTGCAA TGACAATCAA GATTACTTGC ATCGTGAAGT TACTCGGTAC 1740 

ATTAAATAAA AAATGTAAAC CTTCGTTTAT TTGCAATGCA CCGAAACCTA ATGTTGCAGC 1800 
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CATTGCCTTT TCACCTAATA AAGGCGTCAA TGTAGCGCTG ACTAAGCCAG GATATCCTTT 1920 

ATGAAAGCTA AAATATGCAA ACACTAGCGC GACAATACCA TAGACTGCCC ATGCATGAAT 1980 

5 CCCCCAATGG AAAAATGAAA ACTGCATTGC ATCATTAATT GCAGATTGCG TGCCAGCTTT 204 0 

ATGAATAGGC GTTAATTTGA AGGCATGACT GATTGGTTCT GCCGTTGTCC AGAACACAAG 2100 

TCCTATTCCC ATACCAGCAC TAAATAACAT AGCAAACCAA GACGGCAATG AGAATTCAGG 2160 

10 

ATCTTCGCCT TCTTCACCTA ATGTAATGTT TGCGTATCTC GAAAATAAAA TATACACACA 2220 

GACAAATAAA ATAACTAAAA CGAGCAATAA ATAATACCAA GAAAAATGTA GCGCAATAAA 22 80 

TGTAGTAATG TTTTGCGTGA GTTTTTCTAA CTGTTTCGGA AATATTGCTC CAAAAGCAAC 234 0 

75 

AAATATCGTA CATATCACTA AAGATACCCA AAACACTAGA CTTACTGATT TATTTTTCAT 2400 

AAATACAAAC CCTTTCTGTG TAATGGTAAG TTCATACCCA TAACTGCAAC ATTTTAATCA 2460 

2Q TTTGTAATTT TATATAGACA CAATTAATAA TGCCTCATCT TTTAAAAATG ATATATAAAA 2 520 

CACACTCAAA TTATTTATCA TTGAGCAACA AAGTATTTTA TTGTATTTAA GTAATGCCTT 2580 

TCTAGTGCAT TATTGATTTG ATACCTGCAA AGTTGCCATA TTTCCGTTTA GAATCAATAG 264 0 

25 TCGCTAGACA CAAAAAATAA GTCGCCTATA CAGTATTTTC TGCATAAGGC GACTTTACTT 2700 

ACTAATCTAT ATATTAATTA CTAATTTTCC AATCATTGAT TGTTTTTCCA ACAATTGATG . 2760 

TGCTTGATAT AAGTTTTCAG GTGATAAACC TTCAAAAACT TGTGTCGTTG TTGGTTGGTA 2 82 0 

30 ATGCCCTGAT TCTATATTTT TCGTAATATC TTCTAAATAC TCATGTTGTT TAATCATATC 2880 

AGGCGTTCGA TGAATTGGAC GCGCAAACAT AAATTCATGT GTAAATGTTA TACTTTTTAA 2 94 0 

TTTTAATGCA TTTAAATCTT GATCTTCATT AAAAGCTACG ATAGTCGTAA TATGCCCTAA 3000 

35 

TGGTTTTATC AGTTCAATCA TAGTATTGTA ATACAAGTCT GTATTATAGG TGCAAAATAT 3060 

ATAATCTACT AATGGAATTT CTTTAAATTG ACGCACTAAA TCCTCTTTAT GATTCAATAC 3120 

GATATCTGCG CCCATCTTTT CACACCACTC TGTTGTTTCT TGTCGTGATG CTGTTGTAAT 3180 

40 

GACAGTTAAA CCATACCGTT TAGCAATTTG AGTGGCTATA CTGCCTACAC CACCGGCACC 3240 

ATTAATGATT AAGACAGACT TCCCTTCGTT TTCAGCAGGA TTCGTAGAAA TTTTAAATGT 3300 

4S ATCAAAAAAC GTTTCATATG CCGTAATACC AGTTAGCGGT AGACTAACCG CTT CATTAGC 3360 

ACTTATGTTG TGTGGTGCTT TTGCAACTAT AGCTTCTGAC ACCAATTGAT ATGTCGCATT 3420 

TGATCCTTGT CTATTTGGCG ATCCAGCATA AAATACAACG TCACCCGGAC TAAATAATGT 34 80 

SO AACGTCTGGT CCGATAGCTT CAACAGTACC AATAGCATCA AACCCAAGTA CACGAGGTGC 3 54 0 

TTGAGTGACT TCCATTTGTC GTTGCTTTGT ATCTACAGGA TTTACACTAA TGCTATTTAC 3 600 
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ATTTCCTTCT 


TCCAATTTAa 


AGGGCTTCTC 


AAATCCTATC 


ATTTT CAT AT 


CGTTTCACCT 


3720 




CATTTATGAA 


CTTATTTCTT 


ATTATACAAA 


ATAGAAGCCA 


iuioi v?v_ x x f\ 


x Al v_L*lLAQjvJA 


3780 


5 


TCATGACTCC 


* » * • • * a ^ 


GAATATATAA ATAATTACAG 


nUunv. XXX V-lj 


nr^ft ^ r ^^^^^^ 
1A1 1 AAA 11 x 


3840 




TAGACTTATT 


TCTACCATGT 


TGCTGAACAA 


ATTTACTTTA 


AT A aaaaaT 


TATTAAATTT 


3900 


10 


TGGTCAATTA 


ACAAAGTTAn 


TTTGTTAAAA 


CGTgATACTT 


hp ft r i w i ■ ft * i — f ^f^f**/"* 
inl lAl X<_VJVj 


TTACTTTAAT 


3960 


AAPTTdTTTA 


P P* A A A PiTT A *P 


CGCCAGTaAA 


TAAATTTTTA 


fi TV T , /~» /""'TV riyin 

AA x UuAXvjTG 


GCGCATTTTC 


4020 








CTTGTGACTG 


AATTTTACCT 


TCTTGAACCC 


JV 1 1>/ »M Wl V* ^ TV TV /"» 

ATGTTGCAAG 


4080 


16 


<'**P< "i'T"! 'PAr "rA 

w X VJ X X l^W. X -rt 




AAGCATTAGC 


GAATTCACTT 


AULAALjcAAGC 


CTCTCATCAT 


4140 




T*7A PTT^fTTr' 
Xvxl.1 X V_ 


*F*FA ATA A/VY* 


TACCTTGAAT 


ACGTGGTCCG 


ATATCGGdT 


CAGGATGATT 


4200 




atatysacy^a a 


A T^Prt/^/VP* A P* 


ATACTGGTAC 


ACGTGCAAAA 


CGATTTAAAT 


GCTTAAATAC 


4260 


20 


TTPATrfippa 

X ivnlWuLLn 


APTflTTPPlVr 


CAACATTTTC 


AAAATAAACA 


TLAATACCAT 


CTGGTACTGC 


4320 




TTfZ TfZ (T A A P 1 


•jv, 1 1L ±\»\—J\A. 


AATCCTCTTT 


CTTATAATCA 


TA ^*TV /"^ TV ^^y^ rr^ 

ATAC CAGCGT 


CAAAGCCCAG 


4380 




lulLlL. 1 Vj 1 x 


AAA1AA1 1 1 A 


CTTTTTTGTC 


GCCACCCGCA 


ATACCTACTA 


CACGGCAACC 


4440 


25 


X x inn X v_ X in 


ppiaTTTrfif 

ovJVii x luAL 


CTACAACTGA 


ACCTACAGCA 


CCAGATGCAG 


CTGAAACCAC 


4500 




AAPVAGTATPA 


V- LuuL X X X 


GTTGTCCAAT 


ATCAAGCAGA 


CATGATATG 


CTGTTTGTCC 


4560 




x vjvj ^_rv X iuLl 


A A A AP* AP*TTA 


AATATAAATC 


AAGTGGTACA 


TCTGTCGTTG 


GAACTTTAGT 


4620 


30 


AATTTn AT P*P 


vjV— x X uOALn X 


GATTAATGAT 


TCGCCAAGGC 


TV jv /^TV rr*TV /"^/ »« 1 1 TV 

AACATACCTA 


CZAACGACATC 


4680 




TCCTTTTTTA 

XwWX XX X X 1/1 


TAATPTCPf^A 


GTGTCGAATC 


AATTACTTTT 


bv-AAUGACAT 


GGCTAACAAT 


4 74 0 


35 


CGGTTTAC f*A 


ATTTPAAAAH 
a X X X UAAMnvj 


GCTGTACATA 


CGAATCTGCC 


11 Aij 1 vJA 1 AvJ 


GTCCTCTCAT 


4 800 


ATATGGATCP* 




ACAGCGTTTG 


TACAAGTACA 


CCATCGCTCT 


CAAGTTTaGG 


4860 




CGTGTCAATC 


TCTTCaATTT 


TGAATGTATC 


CTCTTGAGGC 


ATPPPVTP'IV 1 
AlV9<~V_K 1L XVa 


GTATTTTGTT 


4 920 


40 


AAAAAGAATT 


TGTTTATTTT 


GCATCATTAA 


TCACCTTTCT 


TTATTTGAAA 


C 1 iTlACTTA 


4 980 




TTTGTTACFT 


AAG CGTTAAG 


TTTGAATTGT 


GTCtTCGTGA 


1 0 1 V- lo X A X Vj 


Pi* n*"p jv ^**iv n^nr* 
L-AAA1 ACATT 


504U 




CTTAGTTGTT ATATTTTGAC TTAAGCACTG ATTCATTCAT 


GTAACTTCAA 


^/"» JV ^ }V MWMK H^TV 

CCACAxTATA 


5100 


45 


TTTGCTATAA 


TCATAAATTT 


AAAATGTTAC 


GACTTAGACA 


TTTTATGGAA 


& / JV TV TV 

ACTCTCAAAC 


5160 




AATAGATAAT 


TTTTGAAAAG 


CTCTAATATT 


ACAAGCTTTT 


TTGCCCCAGA 


AAAACTAGCA 


5220 




GTTGCTTTAT 


TTTTl'CCATA 


AGAAGTCGAT 


TAACTCATTA 


GCAACATTTT 


CATTCTCATG 


5280 


50 


AAGCTGACTA 


TGTTGTGCAG 


GCTCACCTTC 


ATATTTAGAT 


TCTCGATAAC 


TTTTCGGACT 


5340 




ATTTCCCAGT 


AAATATTTTA 


ATGATTTCGA 


AGAACTATTA 


GACACTCTGC 


CGTCTGAATG 


5400 
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CTACTAAATA 


TTGACCATPA 


rrAATArt/iTr 

LLiinlAWlv. 


CAATTTCATT GAATGTAGTC 


CAATATTTTA 


7320 




CTTCTGGGAA 


TTCTTTAAAA 


PA ATATTPAfi 


CATAATCTAC 


AAAGTAGTCA 


ATCGTTTTAC 


7380 


5 


GATTTAGAAA 


ATCGCCATCT 


TTGTGTAaCA 


CTTCTGGTGT 


ATCAAAATGA 


TGCAATGTTA 


7440 




CAAATGGTTC 


AACATG A PG T 


TTATGACACT 


CTGCAAATAA 


CTTATGGTAA 


TACTCAACAC 


7500 


10 


CTTTAGGGTT 


AAPTTPri PP A 


TATCCATTTG 


GGAAGATACG 


AGACCATGCA 


ATTGAAATTC 


7560 


GGATACCATT 


AAPArrnaaT 


TTTTCACTTA ATTCTAAATC 


CACTGGATAT 


CTGTTATAAA 


7620 




AATCACTCGC 


X 0\J 1 1 V- 1 


GTGTACCAAT 


ACt"PTT" !*("** I m 1 'P 

A A X X A X V* 


TAAATACGTA 


TCCCATGCTA 


7680 


15 


%*W%»\X^%WV* XXX 


X LV~V? In 


TTTGTCGCAC 


PTTPTGPTTR 

X X X w V» X X w 


ATATGCTGCT 


GTTGCTCCAC 


7740 




CAAAAATAAA 


AlvlX Unuu x 


AATGTTTTAG 

* *• * A A A A A nW 


TCATATGAAA 


AACTCCTATT 


CTTAATTTTC 


7800 




AAATTfTTTnT 


X VxaMLIjaAa X 


CAAGGGCTGC 


X X VJVJ\v\«r\ X V* X 


CGTGTCAATT 


TGATATATTC 


7860 


20 


Af^PArmYJA 




ATTTAATACC 


TAATPTATPT 


GTAT CTTGCT 


TAATATCTTC 


7920 




n x nv) x x riunL 


<tP A A PTT^TT 


GCGCTAAAAT 


GATTAATTGC 


TACTCTTTCA 


TAATGTCCAT 


7980 






1.MX LLw^LnU 


C TG CCGCTTT 


PAPTGGPAPA 

^^v~« x unjv«A\wi 


TGATATTCTT 


CAGCTGCTTT 


804a 


25 


ATTAAGTC PA 

f^X X^^^^U X uv^rY 


x IVjVjUIAAIA 


ATCCACTTGT 


ACCACCACCG 


GCACAAAGTA 


CTAAGACATT 


8100 




X w XXX 1 1C1 


viluninl x x\j 


AAGCTTTAGC 


TGCATCGTCT 


GATACACCAC 


TTGCCGCTAA 


8160 




AJVrTCTAATPA 


uLlli.ll i Lu 


TATCAAAGTT 


TGCTGCAACT 


TTTTCTTTTA 


AATCTGAATT 


8220 


30 


A fTTTPTTT A 

A X X \™. X X X r\ 


LVj ILL! 1L1 1 


CTTCATCAAG 


AATTTCACTA 


TCATAAACTT 


TTAGGAATGG 


8280 




GTAGTAAATA 


aXaaX nl L X a 


CAACAATCAA 


AGTAATAGCT 


AGTACGAATG 


ACCATAAACC 


8340 


35 


AAAACCTGTA 


L.V. L-«M 1 An 


TGC CCAATGG 


ACCTGGTGTT 


GTCCAAGGTA 


AATTCACACT 


8400 


AAAACTATTP 


ATTTfTAA PA 


CTTCAACGAA 


AAGTTTGAAA 


ATCCATACGT 


TAACAATTGG 


8460 




TGCTAATAPA 


AATYV5 A A T A A 
nni OMnn l.r\*\ 


AGAACACAGG 


ATTCAATACT 


AGTGGTGCAC 


CAAATAAAAT 


8520 


40 


TGGTTCCTTT 

X X X V»%? XXX 


A PA P PA A Afl A 

A\JiV»LAAAUn 


ATGTTGGTAC 


AACTGATGCA 


CGTCCAATCG 




8580 




TTTAflATTI'r 

* * A AAA 


GTPATPPAPA 


TAAACATGAA 


CGGGACGACC 


AATGTTGCAC 


CCGTACCTCC 


8640 




AAATGTAAPG 


ATAAACATTT 

AlAAAWil X X 


GTGTACCTGA 


TGTAATAATT 


TTATCTGCGT 


GTTCTCCAGC 


8700 


45 




TTfl A A fTTPP 
x 1 unAU 1 1 IwVJ 


CTTCGATATT 


CG CATATGT A 


ATGGCTGCAA 


TTGCTGGCTC 


8760 




TACAATTGAC 


GGACCATGAA 


TACCTACAAA 


CCAGAATAAT 


GCAAAGGCAC 


CAAAGATAAT 


8820 




TGTGACACCA 


ATCCATCCAT 


CTGCTGCTGT 


AAATAATGGT 


TCGAATAATT 


TTAAAATACC 


8880 


SO 


TTCCGCTACA 


TTTGATTTAA 


AGCTGTTGCG 


AATGACTAAA 


TCTAATGCAT 


AAAGAATGAT 


8940 




GATTACCGCT 


GAAAATGGAA 


TTAAGTCCTT 


AAATACTTGT 


GAAATATTCG 


GCGGTACTTC 


9000 
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10 



is 



20 



25 



30 



35 



40 



45 



SO 



AAATGCTGAT 
AC CATCTTTG 
AGAAATAAAG 
TTTCGCTGTC 
CATTAAAATG 
AATTAATAGA 
GATGGCTCTT 
TTGTGCGATC 
TTCATTAAAT 
ACACTGTATG 
TGCGCTTCCG 
CCAGCTTGAG 
ACAATTTCAA 
ACTTATTTTC 
ATATTTTTGA 
TATACTTGAA 
CCAGCTTCGT 
AAGTAAATGT 
TCTTTTGTAT 
ACTTCAACTT 
TTAACCTTTC 

tcgTatgtta 

CTTTCAATGT 
AGTAAGAATT 
AAACAGTCAG 
AATAATCCAC 
AAAATTGAAG 
TGAGCTACAG 
TGGTCAAATG 



AAGAATGCTG 
GCTGGATCAG 
TTAATTTGAT 
GTTCCTGCTA 
GCTTCCATGC 
AAGATACTTG 
AAATATATGT 
AATTTTTGCA 
CTTTCAGTAA 
CAATATCATC 
CAATGCAATT 
CTGCTGTTAA 
AACCTAATAA 
TTTGTTTCCA 
AACCAGTTGT 
CAGCACCAGA 
GAGCAAATTT 
ATGGTAAATG 
AAACCACTTC 
TCAATACATC 
TAGGCTTAAC 
ATACTTCTAA 
ATGCTTTCTT 
TAACAGCATT 
GTAAACGACC 
AATCTTTGTT 
ATGCATATTG 
TTGGTTCTTC 
CTAATGCAGA 



TTAATAAACC 
AAGCTAAGAA 
TTGTACTTTC 
CTAAAAATGC 
CTTTATCCCA 
AGAATAAGAT 
TACGTGATAA 
TCATTGTCAT 
AATTGTTGTC 
ACCTTGCGCT 
GTTTCCTTCT 
TGCTTCTAAA 
TTGGACTTCT 
AGATGTCGCA 
ACGTAACCAT 
CCATGTAGCA 
TAAAGTTTCT 
AGTTGCTGCA 
AC CTTCAGCA 
AACGTTAAAG 
TTTTGCGAAT 
AAAGAATGGA 
TTGAATGTTA 
TGCGCCTTGT 
TTTAGCGTTT 
ACGTGCATCT 
TGTTAATTCT 
AGTTTGATGT 
AATGATACCT 



TTTAGTTCCC ATAAATGCAC 
CAAGAATCCA CACATCGCTG 
TAGCTTACGG TTAAATGAAT 
TACAAGCCCC ATCGTATAGT 
TTTAAAACCA AATATATTTG 
GACAGGCATT GCAGAAATAA 
TTTCTCGAAA AATGGCTTCC 
CACCCTCTTT TATAAAATTC 
ATTAAATGAT CTTGACCATG 
TCTTTAGCCA ACAGGCTTGT 
TCAATCAGTG CATCTGCTTT 
AACTTAGAAC GTGCATCCCC 
TCTCTATTCA TAGCATTAAT 
GTATCTTTTA ATACTTTATT 
TCACGAGCAG CATCTTCACC 
CGGCCACAAA GTACCCCGTT 
TGGAATAATT CCGCAGAAAC 
TCTTGATCTT TAAAGTGTTG 
AAGCCTTCTA CATATTTCAT 
CGTGGTTCTG AGAATAATTT 
TcAACAcTAC CGTTATcAGG 
ATATCTTCTG CAACACATTC 
ATTTCTTCAG CATCATCAAC 
TCTTTTAAAC GTTTTGCAGA 
ACGTCATATC CAGTTTTTTC 
GAAGCTGGTA AAC CATATTC 
TCCGCAACTA ATACTTTTAA 
TTTGCCATCA TGCGTTTTAA 
TCGTTGTTAC TTAATTGTTC 



TTAAGAATCC 
CTAGCATTGT 
CTGTTAAAGA 
TATATGGTTT 
GCACATATGC 
ATCCATCACG 
CTTTTTCAAT 
TAATAAATGC 
CATCATCGTT 
TTGTGCTCTA 
TGCAAAATCT 
TGCAAATGCA 
CCCCTTTTAA 
TAAGTCATCA 
TTGTTCAATG 
GAATTTAGCA 
ACCAGCACTT 
TGCCGCTTCC 
GTTTACTGGT 
CATTGCTTCG 
AATGTTGTCA 
TGAACCGATT 
ATCATAGTAA 
CCACTCTACT 
ATAAGCAAGT 
AGGATCTAAT 
TTGTTCAATT 
AGCACCACGT 
AATTGATGCG 



9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
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TCATCATAAT 


' TATTTAAATT GACATAACCT 


w X J. X w X \JV». X X 


X A VJ X J. J, 




10920 




AAAGTATTGG 


- Ci l'lTlTTAG TAAATCGTGG 


TCGTTTTfTATP 

X \»w X X X X *^T\ X 


GATTA A & & T 
vxr\x livvxnni 


x V»k» x\»nx%.w x. A 


10980 


5 


ATTCCAGCAA 


CTGTAGAATC ACCTGAACCA 


ACCGGATTTA 


ATACArTTTAT 


TCZTCCZTl A ATA 


11040 




TTCACTCTAT 


AGAATGTATG ATTGTG CTTA 


GCGAATGCAC 


CTTGTGCACC 


TAAAGACACA 


11100 


10 


ATAATCCACT 


CAATCCCTTC GAATAAGGGT 


TGTGACACTG 


CCTGTTTCAA 


ACTTTCTAAA 


11160 


CTTTCATCAA 


GTGGCTGGTT AAGCAATTGA 


TATAGTTPAG 


AAATGTTTGG 


TTTAATGACT 


11220 




GTAGGTTTGT 


ATGGATTTTC CAAAACTGTT 


TGCAAAGT t G 


CACCCGAGCA ATCTAATATC 


11280 


IS 


ACAGGCACAC 


CTTTGTTTTG GCATCGTTCA 


ATGATTTGTG 


CATAATAATC 


TTGATTTAAT 

* * x X- x x^f^ x 


1134 0 




CCTTTAGGTA AGCTACCTGA AATAGCAACT 


GCnTC^AA^TT 

VJW X X WU\V <x X 


TTTCTAATAA 


TTGTTCAAAA 


11400 




TGTTTAATAA ATCCTGCAGC CTCTTGATTA 


TCAATCTCCC1 


GTCCCTGCTC 


TAAAATTTPT 
x nnnn x, x X w X 


11460 


20 


GTTTGTTGCC 


CTTCATGTAA AATTGCAATG 


\—TWJ X X IVvtf IVj 


TTTCACCCTT 


AATGTTATAA 


11520 




AATGCATGCT 


TGATGTCGGC ATGATCTAAT 


TTTTTAGCAJV 

X X X X X 


TAAATTGACC 


TAATTCACCG 


11580 




CCAATAAAAC 


CACTCGCAAG GACTGGCTCA 


>— V, X X X 


CAAGTACTCT 


TGTTACATTT 


11640 


25 


AAACCTTTAC 


CACCAGCTGT TTTACTTACT 


T CTTG AA f*A f* 


GATTAACATC 


ATCTAATTTC 


11700 




AATG CTGTTA 


ATGGGTATGA AATATCAACG 


GATGGATTTA 
x xxx •*» 


ATGTTAAAGT 


TAAAATCATA 


11760 




TGTGTCGTCC 


CTTAATCGTG GTATTCGCCT 


CT*GTPC£^AT*T 

w A X \>r ^ X X 


TTTCTAAGAA 


TTCATCAAAG 


11820 


30 


AAATGTGGAT 


CAGCTTGATC TGCATTGCTT 


CTTTCTA 21 AT* 

w X X X^.XJ"U"\AX 


GTTTAATTTT 


AGCGATTAAT 


11880 




TTTTTGTTCT 


CTTCAGTTGG TTTATATTCA 


G CATT AATAA 


ATGCATCGAT 


AATATCGCAC 


11940 


3S 


ATTAATAACT 


CACCTATAAT ACGTCCACCG 


AAGCCAATAA 


CGTTCGCATT 


TAATTCTTCT 


12000 


TTAGCGTATA ACGCTGATGT CATATCACGT 


ACTAGTGCTG 


AACGAACGCC 


AGGTACTTTA 


12060 




TTTACAGCAT 


TGTTAATACC AACACCTGTT 


CCACAAATAC 


AAACACCTAA 


GTCTGCATTA 


12120 


40 


CCGCTAACAA 


CTTGTTCGCC AACTTTnTA 


CCAAAAATTG 


GATAATGTGT 


TCTTGTGAAA 


1218U 




TCGTATGTTC 


CTACGTCAAT GACTTCATGT 


CCTTTTGATT 


TTAAAAATTC 


AGATACACGC 


1 O O A f\ 

lx'x'4U 




ATTTTTGTAT 


CTGTAACAAT ATGGTCGCAT 


CCTAATGCAA 


TCTTCATAGT 


AATTTTTCCT 






CCTTAGCACA 


TTTTATTAAG CATATCTACG 


CGGATTTGGT 


GTCTACCACC 


ATCGTATTTA 






CCTTCAACAA 


AACCTTTAAC GACATTTTTC 


GCTAATGTGT 


CTCCAACAAT 


TTCAGATCCC 


12420 




ATAGTGATCA 


TTCTTGAATT GTTATGGCCT 


CTAGTCATAT 


ATCCAGAGCG 


TTCATCTGAT 


12480 


so 


ACTTCAGCAG 


CAATCATGCC TTTGATTTTT 


GTAGCAACCA 


TAAAGCTACC 


TGCACCAAAT 


12540 




GCATCGATAA 


CAATACCTAA GTTACCTTCT 


TGACTTTGAA 


CATCTTTTGC 


TACAGCCAAA 


12600 
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TCTAATAAGT ATGATTTGAT GACTTCTTTT AATCGTTTGC CAGCTTCATC TGAACCAATA 12720 

ATAATCGCCA TAATAAGACT CCTTTTTACT TTAATTTTGA AATACCTTTC TTAAAATGTG 12780 

ACATATTTAT TTGTAGGTTA TGAAAATCTT GAGAAAAGGC TTTCAATTTG ATTACGTTTA 12840 

AATTATAAAC ATAAACAAAC AATAAATCAA CATAATATGT TTATAATATG TTTGTTTATG 12900 

ACGTATTTTC AAACAATAAG TGAACATTCA TATTGTGGTG TTGTTTTAAT TAGGTATTCG 12960 

TCTGAAATTG TAGTAAAACT TTGTCGAGGT TCCCGTTGaC ATAAATTTGC ATAAAAAAtA 13 020 

GCCCATAAAT GAATGCAAAT TCACATTCAC TTATGAGCAT ATAGATACAT ATTTTAACAA 13080 

TGCAGTTATA CTTTTAATTT AGTCGACTAC TTCAATATAT GTTTTAATCG TTTCTACTTT 1314 0 

TTCTTCATCT TCATAGTCCA TGACCACTGC AGTCAATTCG TTTAACTGAC AAAATGATGT 13200 

AAAATCTTCT TTGCCAACTT TCGTATGATC GATTAACAAG TATTTTTCAA TTGAATTACT 132 60 

TAGTGCCAGT TGTTGCGTAT AGGCTTCATC TAATGTAGAT GTCATCACAG CACCTTTATT 13320 

TACTGCGTTA CTACTAAAGA ACATCTTGCT AAATCTTAGT TTTTCCAACA TGGCGTTCGC 133 80 

CATTTCACCT ACAAATGCTT CTGTAATATG GCGCATTTCA CCACCAATTA AATAGACACG 1344 0 

25 AAAATGTGCT GTTTGTTTTT CTAACAAAAT TTTATACACC GGCAAACAAT TCGTAATAAT 13 500 

TGTGAGCGTA TGATGATTGA CTTCTTCTGC TAATAGTTCC ACTGTTGTTC CTGGTCCGAA 13560 

AAACAAAGTA TCCCCATCTT CAATTAATGA TGCAGCTTTT TTAGCTATAA ATCGTTTTTC 13620 

TGCAATTTGA CGGGTATGTT TTTCTTTATG CGATATTTCT TTATACTGAA ATGTTGAATT 136 80 

ACTGCGTGCA CCACCATGAA TCTTCGTTAA AATCCCTTTA TTTTCCAATT CAATTAAATC 13740 

TCTTCGAACT GTCATATCAG ACACATTTAA ACCTTCGACG ATTTCATTCG TTCTTATCGT 13 800 

GCCCTTTTTA TTCACTAGTT TAGCAATTTC GTCCAAACGT TCATGTTTAT TCAATGTAAA 13860 

ATTGC2rrC 13868 
(2) INFORMATION FOR SEQ ID NO: 174: 

40 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4549 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
45 (D) TOPOLOGY: linear 



30 



35 



(XX) SEQUENCE DESCRIPTION: SEQ ID NO: 174: 
SO TTAAGTCAAC TTTGTCTATA CGGTTTGGAT CtTCTaCCCA ATGTCTTATA AAAGACAATC 60 
CCGCACCTGA AACATAACTC ATGAAATAAG AAAATGGTAT ACCATTAATT TGATCATTTT 120 
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AATCTTTACC CATACGAAAC ATCAATTGAT AAAATGCGAT GTCTTTTTCT ATCATTTCTA 24 0 

TTAAAACGGT CATAATTTGA TGTATGTTAT CCGTGGATAA CTTAACTGCT CCATTTAACT 300 

5 

TCTCATCATG AATGAAGTCT CTTATTTCCT CCAACTGCTG GTCCTCTAAT TTTTCAAGCA 360 

AATCATACTT ATCATAATAA TGCGTATAAA ATGTACTACG GTTAACATCA GCTAAATCTG 4 20 

CAATTTGTTG CACAGTAATC TCTTCTAATT GGTGTTGATG TAAAAGTTCA ATAAATGCAT 4 80 

10 

TTCTCATTGC AACTTGTGAT TTTCTAATAC GTCGATCTAT AGTCATTTAT ATCAAGTCCT 54 0 

CCCCAATGAT TATAAACGTT ATGTTCATTA TCCCACAAAT CTCCAACATT GATGATTGGC 600 

75 ACACAATGTT TACCTGTTTA ATATAGGTGA TACAAACAAA CAGAAAAAGG TGATAACAAT 660 

GAACCAACAT TTACTAGGAA ATCCAAAATT AACTGTAACT CATGTCAATG AAGTTAAAGC 720 

CGGTATTAAC CACATCGTTG TCGACAGTGT TCAATATGGA AATCAAGAAA TGATTATGGA 780 

20 AAAAGATGTC ACTGTGGAAA TGCGCGATGG CGAAAAATTA TATATTAATA TTTTCAGACC 84 0 

AAATAAAGAT GGCAAATTCC CTGTAGTTAT GTCTGCAGAT ACTTACGGTA AAGATAATAA 900 

GCCTAAAATC ACAAATATGG GTGCCCTTTG GCCAACATTA GGT AC GATTC CGACATCTAG 960 

25 TTTTACACCT GAAGAATCAC CAGACCCAGG ATTTTGGGTG CCAAATGA2T ATGTTGTAGT 1020 

TAAAGTTGCA TTACG CGGTA GTGACAAATC CAAAGGCGTC TTATCTCCAT GGTCAAAAAG 1080 

AGAAGCGGAA GATTATTACG ArTGATTGAA TGGGCAGCAA ATCAGTCATG GAGTAATGGA 114 0 

30 

AATATCGGGA CAAATGGTGT TTCTTATCTT GCGGTGACTC AATGGTGGGT CGCATCATTA 1200 

AATCCACCAC ATTTAAAAgC AAt GATTCCT TGGGAAGGCT TAAATGATAT GTATAgAGAA 1260 

GTAGCCTTTC ACGGAGGTAT mCCAGATACT GGCTTTTATC GTTTCTGGAC TCAAGGTATT 1320 

35 

TTTGCGAGAT GGACAGATAA TCCAAATATC GAAGATTTGA TTCAAGCACA ACAAGAACAT 1380 

CCTCTGTTCG ATGATTTTTG GAAACAGCGT CAAGTGCCAT TATCACAAAT TAAAACACCT 1440 

40 CTACTAACAT GTGCTAGTTG GTCTACACAA GGTTTGCACA ACCGTGGCTC TTTTGAAGGA 1500 

TTTAAACAAG CTGCATCTGA AGAAAAATGG CTATATGTGC ATGGACGTAA AGAGTGGGAA 1560 

AGTTACTACG CTAGAGAAAA TCTCGAACGC CAAAAATCAT TCTTTGATTT TTACCTTAAA 1620 

45 GAAGAAAATA ACGATTGGAA AGATACGCCT CATGTCATTT ATGAAGTTAG AGATCAATTT 1680 

TATAAAGGCG AATTCAAATC AGCGTCACGT GTCCCTTTAC CTAACGCAGA ATATACACCA 174 0 

TTGTATTTGA ATGCTGAAAA TCACACATTG AATCATGCAA AGATTAGTAG CGCGCATGTC 1800 

so 

G CACAAT ATG ACTCTGAAGA TAAACAACAA GATGTAAGTT TTAAATATAC GTTTGACAAA 1860 

GATACTGAGT TAGTTGGAAA CATGAACTTA AAACTATGGG TAAGCACTAA AGACTCAGAT 1920 
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CCTGATTTTA AT CAT ATTGA AAATGGTCAA GTAGCTACTG GTTGGTTACG CGTATCACAT 2040 

CGTGAATTAG ATCAAGAAAA ATCCTCAATC GCGCAACCTT GGCATAAACA TGAAACAGAA 2100 

TTAAAGTTGT CACAAGATGA GATTGTACCT GTTGAAATCG AATTGTTACC TTCAGGCACG 2160 

CTATTTAAAC AAGGCGAAAC ATTGGAAGTT GTTGTAAAGG GTAGTGAAAT TGTAATTGGT 2220 

AATAGTACTC CTGGCATGAA AACACGTTAT GAACATGAAG AAACCGTAAA TAAAGGCATG 2280 

CACATGATTT ATACTGGTGG TAAATATGAT TCACAATTAA TCATTCCTAT CGTTAATTGA 2340 

TATGCAGCAA TTACGGTCGC TTTTGATTAA AAGTGACATA GTGATAGGAC TGTATAACAA 24 00 

GAGAAAGCCA CACGCTTGGA ATCTTAAACC AAGGTGTGGC CCTTTTTATT ATTGATGGCT 2460 

ATTTAATTTT ATAACACTAT CGTATTTTCT TTTTCATGAA TCATTTCAAT AATGACATTA 2520 

TCTTCATTCA TTACTGCTAC TTTAGGTGCA TGGTTTTTAA TTTCTTCTTC ATTCAACTGT 2580 

GCATAAGTCA TGATTATGAC TACATCGCCT ACTTCAACAA GTCTTGACGC TGCACCGTTT 264 0 

AAACAAATTT TACCACTACC TCTTTCACCA GCTATTACGT ATGTTTCAAA ACGTGCACCA 2700 

TTATTATTAT TCACGATGGC TACTTTTTCA TTTGGCAAGA TGTCTACCGC TTCCAATATA 2760 

TCTGAATCAA TCGTAATGCT ACCTACATAA TTTAAATTTG ACTCAGTCA<5 TCTTGCTCTA 282 0 

TGAATTTTAG CATTCATCAT TGTTCTTATC ACTTTATTCA GCTCCAATTA TTATATTATC 2880 

TATTAAACG C GCTTTTGAAA ATTTAACAGC TAAcGAGATA AATATGCGTC CAGTTATTTC 2 94 0 

GTGTTGTTCT ACTAATTGAG GATAACTATA AACAGCAACT TCTTCAATGC GTTCACTTAT 3000 

ATGTGATTCA AGATATTCAG TAACCCTGTC TATAATTACT TTACTTTGAC GTTCACCGTC 3060 

TTGATACAAC GCTTGTGCTA ATAGCAAACT TTTACTTAAA TGTACCGCTT CTTGTCGTTC 3120 

TTGCTCCGTT AAATAAACAT TTCTTGAACT TTTCGCCAAA CCATCTGCTT CTCGAACGAT 3180 

ATCA&TACCA ATAATTTCAA CGGCATGATT GAAGTCTTTT ACCmTTTGCT CG a CAATAG C 324 0 

CAATTGCTGG GCATCTTTTT TAC CAAAAT A AGCATAATCC GGCATAACAA TATTAAATAG 3300 

CTTATTAACT ACTOTTACCA CCCCATCAAA ATGCCCTGGr CCGtTCGCTC CTTCTAACAC 3360 

ATCAGCTAAT GGGCCTACTT TGACATCAAT ACCTAATTCA CCTGGATACA TATCTTCTAC 3420 

TGCAGGATGA AAAACAATGT CCGCTCCTAC TTCTGATACT AATTCTAAAT CTTTATCAAT 3480 

TTGTCTCGGA TAAGCATCGA AATCTTCGTT TGGACCAAAT TGTAATGGAT TAACAAATAC 3 54 0 

ACTCACAATT GTAATATCAT TTGTACTAAC TGATTCGCGT ACCATCGTTA AATGTCCATC 3 600 

ATGTAAGGCA CCCATTGTTG GGATAAAACC AATCGTTGTG CCTGAGCGTT TGGCTGCTTT 3 660 

AACAATGTGT TGCATCTCTT TTACCGTAGT AATCAGCTTA GTCATTGTTA TTAAC CTCAT 3720 
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GATCGTATTG TTTTAAACCA TCCACACCAA CACTAAAATC AGCAAATTGP 


T"1 'f^R /*""?\ IN IN *T*T» 


3840 




TCGCTTTATG TTCAACACCA TAATTTAACA TATCGTGATA AACCAATACT 




3900 


5 


TAcerrrrcc tgcaccaata ccaatgactg gaattgttaa gtgcttgcta 


r\ 4 -1- X Nar A XLX \J 


3960 




CTAAATCATT TGGAATTGCT TCAAGTACTA ACGCAACTGC ACCAGCTTGT 


1 IrfcVvAl 111 


4020 


10 


TCGCGTCTAA AATAAGTTGc TCCGCTGCTT CTTTCGTTGC ACCTTGTAAT 




4080 




TAACGCCAAC ACTTTGAGGT GTTAATCCTA AATGTGCAAC AACAGGAATA 




4140 




TTGul i-i-rrC AATAAATGGT GTAATATGCG CTCCTTCTGC TTTAATTGCA 


TTTGCATTCG 


4200 


15 


TCTCCTGATA AAGCTTTAGA GCATGATTTA AGTCTTGTGT CATAGAGATG 


CCTACTGCAC 


4260 




CAATCGGCAT ATCAACAACT ACAAATGTAT TTGGTGCGCC TCTTCTTACT 


GCACGACCGT 


4320 




GATGAATCAT ATCTGCTAAC GTCACTTGTA CGGTACTTTC ATAACCTAAT ACAGTCATAC 


4380 


20 


CAAGTGAATC CCCAACAAGA ATCATATCAA TACCCGCTGC TTCCACTTGT 


TTAGCACTTG 


4440 




GAAAATCATA AG CTGTTACC ATAGAAATTT TAGTTTG CTT TTGTTTCATA 


TCTATTAATT 


4500 




GACTTACTGT TTTCAATGTT ATTCAACCTC TTTTTGCAGT ATnATTAGA 




4549 


25 


(2) INFORMATION FOR SEQ ID NO: 175: 






30 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 8339 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 







35 



SO 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 175: 

TTATCTTTTG TTGTTTCCTT AGACAAACGA CTAACCACAT TATAATGGAC TAATTTATTA 60 

ATTTTATTTA ATT CCATTAA GTTATCCGTA ACACTAAGTG AAGATGCGGA GTTCACTCTC 120 

40 GTTTGTACTC TTCGTTTTAA TAAAGCACCT CGTAATAATA CAATCATTCT TCTTATTAAT 180 

GATGCTTGTC TATATACCTG TGTTCTTTCA GCATAACGCA TATAGTTTTC AAGTACACTA 24 0 

TTCGTTATTT GTCCTTCATC TACTAAAGAC TCTAATGTTT TkGTTTCTAC ATTAAAAGCA 300 

45 ATTTTTTGTA GACGTTCTAA TTCTTTAGAG TTTTCATCAT CTTTCTCTAC AGTTTTTAAA 360 

AATGCTAATT TATCATGATA TTCTTTAATC ACGTTACCAT ATTTAAAACT TGTTTCGAAA 420 
GTAGATTTTT GATTTAGATA ATCAATAACT TGTTCTAATA TATAAATTCT AGCAACTTTA 
AACGACATAT TGCCAATTAC TGTTTTAGGT GCAGGTTTCG TTAATAATGG CAATAATACT 



480 



540 



TGCGCAACTA CCAAACTAAT AATAACCATA CCAGATGCAA TAAATAATAA GTCGTTTCTA 600 
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ATTGTTCCAT 


GCACACCACA 


TAACGTCATA 


ATTAAAGCGT 


ATAAACTTCG 


CTTTGGTGGT 


720 




TTCTCAGTCG 


TTGGATTATC 


ATCAT CATTT 


TTAGTCATCA 


TTTTTTGGAA 


TGGACTGATG 


780 


5 


GCTAAATAAA 


AATAAGGATA 


TAAGACATAA 


ACCCAAACAA 


ATCTAAATAG 


ATAGACAGCT 


840 




AAAGCAACAA 


CAATAGTGAT 


G C CT ATT AAA 


AAGATTAAAT 


TGTGCGGTTC 


TGTTTTGATA 


900 




ATTTTAATAA 


TAACTTCAGG 


TACTAAAAAT 


CCTAATATTG 


AAAAAACAAA 


GCCATTTAAA 


960 


10 


ACATAACCTA 


GTATATTCCA 


TGTATGATTG 


TAACTCATTT 


GCAGTTGTGT 


ACGTACTTGC 


1020 




ATAATTCTGT 


CACGTTCGAA 


ACCATGTACA 


AGTCCTGCAA 


CTACTGCTGC 


AATGATTCCT 


1080 


15 


GATGCGTGaA 


ACAATTCAGC 


AATTAAATAC 


GTAACAAATG 


GTGTTAACAA 


TTGAATAATT 


1140 


GTAAACATAT 


TAATGTTTTC 


AT ATC CTCGA 


CGCATCAATG 


TTAATCGGAA 


CCTTACTAAT 


1200 




GCCATACCTA 


TAAGTAAACC 


AACCACTGCG 


CCACCAATTG 


ATGCAATTAA 


AAACAACTGA 


1260 


20 


ACAGCATCAA 


CAAGTGAAAA 


AGCAC CTGT A 


ACTAATACTC 


CAACAGCTAT 


TTTAAATGAA 


1320 




ATAATACCAG 


CAGCATCATT 


CAATAATGAC 


TCACCTTCAA 


GAATTGTCAT 


TGCTCCTTTT 


1380 




GGCAAGACCT 


TTCCTTTAGT 


GATTGCTTGC 


ACTG CTACTG 


CATCAGTAGG 


ACAAAGAATG 


1440 


25 


GCAGCAATTG 


CAAATGCTGC 


TCCAATAGGT 


AAATCTGGCC 


AAATCCAATG 


AATAAATAAA 


1500 




CCTACACCTA 


TCACAGTAGT 


AATGACTAAT 


CCTAATGCCA 


TCATCATCAC 


TGGCTTAATA 


1560 




TATTTCCTTA 


AATGGACTCT 


AGAAACATTA 


ACACCTTCTA 


CAAATAACAA 


AGGCGCAATC 


1620 


30 


ATTGTTACCA 


TAAACAATTC 


AGAATCAAAA 


TTAAATTGAA 


CAGGGATTGG 


GGTAATAAAT 


1660 




AGTAACATGC 


CCAAGAAAAT 


TTGTATAAAT 


GCTAGGGGTA 


CTTTAGGTAT 


GAAAGTATGG 


1740 




ACAAACGAAC 


TTAGTATCAC 


AACAGCTATA 


AATATAAGAA 


TTGTTTCAAA 


TATTTCCAAA 


1800 


35 


CTTTCACCTC 


TCTAAAAAGT 


ATTGTTTAAT 


TGAAAATTAA 


GTATCACATC 


TCGTTGTAAT 


1860 




TATACTTTAG 


AGGATAAATT 


GAGTTAGCGA 


CCACAAAAGC 


ACTTTAATAT 


AGATATATGT 


1920 


40 


CTACGATTGC AGTACTTAAA TTTGCAATTA TTTAATTTTA 


TTTTATCACT 


AATTGTTTGT 


1980 


ATAAATAAAC 


AACTTGCTTT 


CACATAACAA 


CATTAACTTA TAATACAAAA AATGAGCACC 


2040 
2100 




TTAAAATCGA 


CTAACCAATT 


TCaAAGTACT 


CI 1 1 TAATGA 


TTAATTTTCA 




45 


TCaAAAGCAT 


TGTTATGCTT 


AACAATTTAG 


CCAACACTTC 


AATCGTTTTG 


ATACCATTTC 


2160 




TTACGATGCT 


CTTCTCGTTT 


TTCAGCACGT 


AATTGTAATG 


CTTCTGTAGA 


GTTTTGTTCA 


2220 




TTTGAACTTA 


ATAATATTGA 


TGCATGTGTG 


TGAGCATCAT 


TTTTTCGATA 


CATATAAGCG 


2280 


50 


CCGTTGCGAT 


AAGCAGCGCG 


AGCGACTAAG 


TGCATGCCGA 


CTGGTGAAGT 


TAAATTAATA 


2340 




AAAACAAGTG 


ACAGTAATAA 


ACGCACACTG 


AAAAATCCTG 


T ATT CACAAT 


AAAATAAATT 


2400 
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CTTAAGAAAA CATCTTGGAA TTTCACGATA CCTATTGCAC TAATAAGAGC AATAAAACTA 2520 

CCTAACAACA ACATCACAGC AGCAATAAGA CTAAAGATTT CTTTTGTTAT TTCCATTAAA 2580 

CACATGCCCC CCACCAATAA AGCGTGATAT TGAAACAGAA CTTACAAAAG AT ATAATGG C 264 0 

AATGAGCATG ATTGAATCTA AGAAAGAAAC GGTGCCCATA AGTACACTTA ACACACCCAC 2700 

AATTGACATT ACGACAGCAC TTGTTGT AT C AAATGTAACG ACACGATCTG CTGTTGTAGG 2760 

TCCCTTGATT AATCTAAATA AACAGATGAT TAATGCAATT CCAAAAATAA TGAGTGAACT 2820 

AATAATCATA ATATGTGTTA TTG TTTGTAT CATCGCGACA CCTCCAATAT TAAGTCTTCA 2 3 80 

15 TAATGCTTAA TACTTCTTAA CAAACTATCT rr rr CTTTTT CTGACACGTC GATACTATGA 2 94 0 

ATAAAAAACT TTTTAGAGTC TTGAGAAATT CGTATTACTG TAGACCCTGG AGTTATAATA 3000 

ATTAAAATTG TTAAAAATGT TATTGACCAA TCACTTGTTA GTCTTGTTTC ATATGAAAGT 3060 

20 AATC CAGGGT TCATATCTTT TGTTTTAAAA AGAATATAAT TAATCGTGCT AATGCTAGAT 3120 

GTTATTAATT GATATAAATA AACACCTAAA AATTTAATAG CT AC C CAT AT TTTTCTAACA 3X80 

TAAAAATCAT CGCTGAAAAA CCTGTGTAAT ATATAAATGA CAATTAAACC AATTAGATAT 324 0 

CCAGAAAAGA AAGTCGAGAA TTTAAAATGA TCTTCATCTT GAAATAATAC CCATAAGAAT 33 00 

GCAATGATAA TATTTAAAAC TATTTGATTC ATTTAGTCCT CTCCTTTCAA ATGCGGATTT 3360 

ACAAGTTTTT GATATAATTG ATCACTCGTG TTCAACTCAG TTGCATCACT TGTAACATTT 34 2 0 

AACACAACAG GTGCAGCAAT TCCGATTGCG ATAACCACAA CTACTAAAAT ACTTAAAATT 34 80 

CTTTTT CGAT ATAGCGGGAT TTTCTTAAAA TTAACTTCCT CCCCATCTTT ATCTCCAAAA 3540 

TACATATAAA AAAGTATCCT AAATAAACTG TACATTGCAA TTAGACTAGT AATAATCATT 36 00 

AACGCTAGTC CAATATAATT GCCATTTTGC AATGCAC CTT GGAAAATAAG TACTTTCCCC 3660 

GGAAAGCCAC TAAATGGAGG CACGCCGCCA ATAGCAAAAA TCATTATAAT AAACGCAACT 3720 

CCAAATAAAG GTTCTTTTTT AGCTAAGCCA TTCAAATATT GATATTGTCG ATAGCCTGTA 37 80 

ATGTAAACTA AACTACCAAT AATAAAAAAT AGCAATGTTT TTACAACAAT GTCATTTACC 384 0 

AAATAAAATA TTGCACCATT AATACCTGCA AACGTGTTTG TTCCTAAACC TAAAATGATA 3900 

45 AAT CCTATTG AGATTATGAC TTGGTAAGCT GCAATCTTTT TAATATCTTT ATAAGCAATG 3 960 

ACACCTATAG CGCCGATGAC CATAGTTATA GCAGCCATAG TTGCTAGCAA TGGATGTATG 4 020 

AGATCATTAT GTTGATCAAA TAGTAAAGTG AAGAATCGAA TTAATGCATA GGCCCCTACT 4 080 

50 TTGGTCATTA ACGCTGCAAA TAATGCTGCA AGCTcAGTAT TTAACACAGC GTAGGCTTTG 414 0 

GGT AG CCACA TAAAAAGGAC CAGCGCTGCT TTCGCACTAA ATGCGACTAA GAAGATTAAT 4 200 
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20 



25 



30 



35 



40 



45 



SO 



AAGTTTAATG 
CCAATAATAT 
AGTGTAATGA 
AAATCTGATG 
AAGTGATAAC 
ATCACAAACG 
CCAAAGGGCG 
ATTAATAGCA 
GAAATACGAT 
ATTGGTAAAA 
TTCTTTTGTT 
CCCTATAACT 
TCCACCAGTT 
GAGATTACCA 
TAAAATCATA 
CATGATCGAC 
AAAATACCTA 
ATCCAAGTTG 
GTAATAGATG 
TCTAAAACCT 
AAACCACCAA 
AAAGTCAATA 
TTCATCTTGT 
AATTAACACT 
TACAATATTT 
TAAACCATCT 
TGATACAGAA 
TAATCTTGAA 
CAATG CTAG A 



TACCTACTGT 
TCAAGACAAC 
GTACAAATGA 
TTAGAAAAGA 
GATTTGCTTT 
AAGCGGTTGT 
CTGACCATCC 
TTAATGAAAT 
CATTATTTTT 
TCAATAAGTT 
ACTTTATAAG 
ATTGCAGTTA 
ATTAGTGGTT 
GCATGAGTAT 
TATGTTCCTA 
CTCCGCTAAG 
ATTCAAAAAG 
TTTCATATTG 
ATACCAATGC 
CTTCAACATT 
TAAACCCACC 
AAATAAATAC 
CCCCTCCGAT 
AATCCTTCAA 
TTACCACCTG 
GTTTGTTGTG 
ATTTTAATTA 
AAACTGACAA 
TCAGGGGCTT 



TTTATAAAGT 
ATAAATAATT 
CGCTAGTAAC 
GCCTATCACG 
ATGTTCGCCA 
AACCATAATT 
TCCAAAGTCT 
AATTGTGGTG 
TAAAAATACA 
ACTTAGCATC 
TTCTATAAAC 
GTACAATAGC 
CTGATCTACT 
ATATTGAAAT 
TAAACACTAA 
CGACAACATC 
TGTTATTGTA 
AGACAAAAAT 
TCCAATAATC 
AAAAGCCAGA 
ACCAGGATTA 
AACAAGTTTC 
CTTGATAATT 
ATAATGTATC 
TTAGTTTGTC 
TAATAAAAAT 
TTTCTCTTTT 
TAAATAGTAT 
TCATTGCTAT 



AAACCTATAC 
GCAGCACGTA 
ATAATTTCAA 
CCAACACTTA 
CGCCCAAATC 
AAACTTAAAG 
AGCGTAATTG 
ATAGTCATTG 
AGGATTAAGG 
ATCTTCCCCC 
AAGTACAAGT 
TTGTAACAAG 
AGAACCATAC 
TCCGATTACA 
AAATCCTATA 
ACTGTGACAA 
CTTACATGAA 
GGTTTTCCAA 
ATTAAAATTC 
AACATTAAAA 
TTATGACCTG 
GTGACCGTTC 
TAATAATGtg 
TAATGCTCTA 
AGCTTTTAAA 
TAATGATACA 
TTTGTTAGCG 
CGTCGTTATT 
AAAGAATAAG 



CTAATAAGAA 
ATTGTTCTAC 
ACATGACGTA 
AAAATAATAT 
CGTATGCCAT 
AATCTCCTAA 
GACGGTGACG 
TACCTAAGTA 
CACAAAGGAA 
CTTAGGCCTT 
AAAAACGCAG 
GGATCAACAA 
GTTCCCATAC 
ATACGAATTA 
ACTAGTAATA 
TAACACCAAC 
TTTGTCCTAA 
AAAACATAGG 
TAAAATCAAT 
TAAACGCTGA 
CGAAGAAGAC 
TTAACACGAC 
TAAATACCTA 
AAGTCACCAA 
TAAAAGTCTG 
ACAATAAGTG 
TTAGATCTTG 
GTTTCAACTA 
GTCACAACAA 



TAGCCATGAA 
AGATTGTCCA 
TAAATTAAAT 
GAACGATGGC 
AATTAAAGTA 
AAACTGTATA 
CTGAACATAA 
TAAATATTTA 
TGGTAATAAC 
CAATTTCATC 
TCATCCCAAA 
ACAATTGGTT 
TCATAATAAT 
AATTGATTGA 
ATATTAAATT 
AACTGAGAAT 
AATTGGAAGT 
TATTATCGCA 
CGGTAAACTT 
ACTAAATATT 
ATAGAATCCG 
ATCATTCTCT 
GCCCAGTAAT 
GTATCGCATT 
ATATTGATGA 
CCATCAAGAG 
GCACGTTTGG 
CTAGCTGAGT 
ATCCGATGAC 



4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
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GACAGTTACG 


ATTGCTAATA 


TAATTTCTAA 


TGCCCCAAAT 


TCAGAAACAT 


GTAACTGATG 


jfi on 




TACTTTAGGA 


AGTCCaATTC 


GAATATAACC 


ATATCCAATG 


ATAATCATAA 


ATATGCCTAA 


£ l Q rt 


5 


GGT CAT AATA 


ATGTACTGGT 
AAATGTCGAT 


TTAAACGATC 


TTGCATAACA 


CGTTTAAATC 


GCTTCGTAGC 


u 




AAACTTTTCA 


ATACCATCTC 


ATAGCTTTTT 


GAAACTGAAA 


TCTGTCTAAT 


£ "a n n 


10 


TTT AC CTGTG 


AACACriTIT 


TC CAATCTAC 


TTTGATTGCT 


AGTACACTAC 


CCAATAAAAT 




AATGATGATG 


GTTAAAAGAA 


GCGGTATGTT 


AAATCCATGC 


CATTGCGAAA 


CATGTGGTGC 


O ** Z. \J 




CAATTGATCA 


ATTTGATGAT 


TACCACCTGA 


TACAGCTCTT 


AATGCnAGAA 


CGATAATCCC 


Oft o u 


1S 


CTTCCCAAAT 


ATATnTGGTA 


CAAAAAAGAT 


TACAGGTACT 


AG CACCATTA 


aTATAAGAGA 


w J *■ U 




TGGTAAACTA 


aACAACCATG 


GTTCGTGGAT 


ATTTT1"1"1TA 


GTAAAAACCT 


TAGAATCATA 






rrrrutccAA 


AATACTTCTT 


TTAC CATGT A 


TAGTGCATAT 


GTGAATGTAA 


AAACA CTCGC 


OODU 


20 


AATAACACCA 


ACAAACACGA 


TAGCTATCAT 


TGAAATCAAA 


CTAAATTGGG 


ATAATTGTCC 


fiT? n 




AGTTTGTGTT 


AATGCATCTA 


AAAACATTTC 


TTTACTTAAA 


AATC CATTTA 


AAAATGGTAC 


D A O w 




TCCAGCCATA 


GATAGAGCCG 


CTATCGTCAT 


GACT AGATT C 


ATTTTAGGAA 


ATAGTTGACG 




25 


CATTCCACTT 


AAAATTCGTA 


TATCCCTTGA 


ACCTGCTTCA 


TGATCTAAAA 


TAC CTACTCC 


O i7 V V 




CATGAAAAGC 


GCACATTTAA 


AG ATGG CATG 


ATTCATTAGa 


TGAAATAGcG 


CACCArATAA 


6 96 0 




TACmAATACA 


TAAATaGATG 


CTATTGCGTC 


TTGTTGGTGT 


TGAGCATATC 


CGCCACCTAT 


7020 


30 


ACCCACCATA 


GCCATAATCA 


TC CCAAGTTG 


ACTGATTGTA 


GAGTACGCTA 


GGATACCTTT 


/ \J o V 




TAAATCCCAT 


TGTTTTAAAG 


CTGTAATTGA 


ACCAAATAAC 


ATTGTTATTA 


AACCAACAAA 


7140 


35 


CGTAACGATA 


TATACGTACA 


TATTGCTAnG 


ACCTAATAAT 


GGTGTAAATC 


GAAGTAATAG 


7200 


AAnGATACCA 


GCTTTTACCA 


TCGTGGCTGA 


ATGTAAATAA 


GCACTTACAG 


GTGTAGGTG C 


7260 




AGCCATTGCT 


CTAGGTAGCC 


AGTATGAAAT 


GGAraTTGTG 


CTGATTTTGT 


AAATGCACCT 


7320 


40 


AATAAAAACA 


TAAAAATCAT 


AGGGATAAAC 


AATCCATGAT 


TCTTAATATG 


ATCTGCTTGT 


7380 


CCTAATATCT 


CTGTGATGTT 


ATTCGTTCCT 


GTCATGATAT 


ACAGCATAAT 


AAAACCAACT 


7440 




AATAACGCCA ATCCACCAAA 


TACTGTAATC 


ATAAATGATT 


GAATCGCACC 


AAATTGACTG 


7500 


45 


TCACCATTGT 


TATACCAATA 


TGAnATCAAT 


AAAAATGATG 


ATmCACTCGT 


TAATTCCCAA 


7560 




AAaATGTACA 


TCmATATCGT 


ATTGTCTGAT 


AATACaaTAC 


CAATCATACT 


GAACATAAAT 


7620 




AACGTTAAAT 


AAAAATAAAA 


CCTTGGTAAA 


TTGTCTTTTC 


GAGAGGATAA 


ATATTGAGTT 


7680 


50 


G CAT AGAAGA 


ATACTGCAAT 


TCCAATAAGT 


GAAATAATAA 


GAGAAAACAT 


TAAACTTAAA 


7740 




CCATCTAAAC 


GTAAATCTAA 


ATTAATATCT 


AATGTCTTAA 


TCCATGGAAT 


AGAGGTAGAA 


7800 
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w 



15 



GGTGCAACCA ACGCTATGTA CCCGGCATAT TTAGCCAATG CTCTACGTTT AGACATTAGA 7920 

AGTATCATCG CCATAAT CAC AAGTATAGCA ATTAATAAAT AAACCAAACT CATT ATT AG C 7980 

CTCCTTTGTT TCTATAATTG TAATGAAATA TAAATACTAT GTTCACACTC ATTTTCTAAA 8040 

CCGATAAAAT TTAGTGTTTC AATAGCAGAT TGATGCCCTA AATACTTTTG AATGACTGGT 8100 

ATAAGTATAC CTTTTTGATA AGCATGATAT GCAAATGTCT TACGCAATGT CGTTAGTCCT 8160 

ACATTATCTA TACCAGCTTC AATTGATGCT TGGTGAATTA TTCGATATGC TTGCTGTCTA 8220 

GATAATACTT GATTTGTTCG TAGTGATTGA AAAAGAACGT CTTCATTCGA AAGACTCCTG 8280 

TCCTCTATAT ATTGAAGTAG TTCTTTCGAT AATGTTTCTG GTAACCTAAT TTTAATCAA 8339 

(2) INFORMATION FOR SEQ ID NO: 176: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 588 base pairs 
(B> TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 176: 

CCCGATTTTT TTACGTAATC TAATACATAC GGCAAAATCA ACTTTAATCA AAAAAGACTC 6 0 

ATACACAATG CCTTTAAAGC ACATGTATGA GTCCTTTTTA GTAGTTTATA TCAAAAAATA 120 

GTTTAATGTA TAAATTA^TT TTTGTTTACA GATGCGTCGT AGATTGATTC TACAGCATCA 180 

CCTAAAGCTT TATCGAATTC TTCTTTAGAT TGATCAGCTC TTAAATCACT AGCTAATGCA 24 0 

CGTGAGAAAC TTGCGATAAG TTCAGCGTTA TCTTTAAGTA ATTCATTTGC TTTTTCTCTG 300 

CTGTAACCAC CTGATAATAC AACGACACGA ACAACATTAG GATGTTCAGC TAACTCTTTG 3 60 

TATAAGTTTG GTTCAGTAGG AATTGTTAAT TTCAACATTA CTAATTGATC AGCATTTAAG 420 

CTATCTAAAC CTTTTTTAAG TTCAGCTTTT AATACTTTTT CAATTTCAGC TTTGTCTTTT 4 80 

GCATTAATAT TAACTTCTGG TTCGATAATT GG AACTAAAC CTTTAGCAAT AATTTGTTTA 540 

GCAACTTCAA ATTGTTGTTC AACAACGTCT TTGATACCTT GCTCATTT 588 
^5 <2) INFORMATION FOR SEQ ID NO: 177: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2841 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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ATAGAGTnCT GGnACTTACT ATGACATATG GCGCTAGAAT GGCTGAGCCA GGTGAATTTA 
CAAAACGTGC CTTTTTAAAT GGTCGTATTG ATTTATCTCA AGCTGAAGCA GTTATGGACT 
TTATTCGCTC GAAGACAGAT AGAGCTTCTA AAGTTGCGAT GAATCAAATT GAAGGTCGTC 
TAAGTGACTT AATCAAAAAA CAACGTCAAT CTATATTAGA GATACTCGCT CAAGTGGAAG 
TGAATATTGA TTATCCTGAA TACGATGATG TTGAAGATGC GACTACTGAA TTTCTTTTAG 
AGCAGTCTAA AGAAATCAAA CAGGAAATTA ATCGTTTATT AGATACCGGT GCGCAGGGTA 
AAATTATGCG TGAAGGTTTA TCTACAGTTA TTGTTGGTAA ACCAAACGTA GGTAAATCAT 
CGATGTTAAA TAATTTAATA CAAGATAATA AAGCGATTGT AACTGAGGTA GCAGGTACTA 
CTAGAGATGT CTTAGAAGAG TACGTCAATG TTCGTGGCGT GCCATTAAGA TTAGTTGATA 
CTGCTGGTAT ACGTGAGACA GAAGATATAG TAGAGAAGAT TGGTGTTGAA CGCTCTAGAA 
AGGCTCTTAG CCAAGCAGAC TTAATTTTAT TTGTATTAAA CAATAACGAA GCATTGACwC 
AAGAAGATTA CACATT ATAT GAAGTGGTTA AAAATGAAGA TGTAATCGTA ATTGTTAATA 
AAATGGATTT AGAGCAAAAC ATAGATATTA ATGAAGTTAA AGATATGATA GGTGATACGC 



900 
960 
1020 
1080 
1140 
1200 
1260 
1320 



GACATATTTC ATTATTAAAA CAAGCAAGAC AAACGATACA AGATGCGATT GATGCAGCAG 
30 AATCTGGTGT GCCTATGGaT ATGGTACAAA TTGATTTAAC TAGAACTTGG GAAATATTAG 
GAGAAATTAT TGGTGAGACT GCAAgTGATG AACTCATCGA TCAGTTATTC AGTCAATTCT 
GCTTAGGTAA ATAGTAATTG AAATAGACGG AATAC CGTCT TAAGAAGGCT AGTAAGATAT 
35 CAAATAAGGA GGTTTATATT GTGGTTCAAG AATATGATGT AATCGTTATA GGTGCGGGAC 
ATGCAGGTGT AGAAGCAGGT TTAGCATCTG CAAGACGTGG TGCTAAAACA TTAATGCTAA 
CAATAAATTT AGATAATATT GCATTTATGC CATGTAACCC ATCTGTAGGT GGACCAGCTA 
40 AAGGTATCGT TGTTCGTGAA ATTGATGCTT TAGGTGGACA AATGGCAAAA ACAATCGATA 1380 
AAACACACAT TCAAATGAGA ATGTTAAATA CAGGTAAAGG ACCTGCTGTA AGAGCACTAA 144 0 

GAGCGCAAgc AGaTAAAGTA CTTTATCAAC AAGAAATGAA ACGCGTGATT GAAGATGAAG 1500 

45 

AAAATTTGCA TATAATGCAA GGTATGGTAG ACGAACTTAT TATAGAAGAT AATGAAGTTA 1560 
AAGGTGTACG TACAAATATT GGTACAGAGT ATTTATCTAA AGCAGTAATT ATTACAACGG 1620 
GAACATTTTT ACGTGGTGAA ATCATTTTAG GTAATATGAA GTATTCAAGT GGACCAAATC 

SO 

ACCAATTACC ATCAATCACA TTATCAGACA ATTTAAGAGA ACTTGGTTTT GATATTGTTC 



1680 
1740 
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25 



30 



AAATACAACC 


AGGTGACGAT 


GTAGGTCGTG 


CATTCAGCTT 


TGAAACAACA 


GAATATATAT 


I860 


T AGAT CAATT 


GCCATGTTGG 


CTAACGTATA 


CTAATGCTGA 


AACACACAAA 


GTTATCGATG 


1920 


ATAATTTACA 


TCTATCTGCA 


ATGTATTCAG 


GGATGATTAA 


AGGAACCGGG 


CCACGTTATT 


I960 


GCCCTTCAAT 


TGAAGATAAA 


TTTGTTCGAT 


TTAATGATAA 


GCCGCGACAT 


CAACTTTTCT 


2040 


TAGAGCCTGA 


AGGTCGTAAT 


ACAAATGAAG 


TATATGTGCA 


AGGATTGTCT 


ACAAGTCTTC 


2100 


CTGAACATGT 


GCAcGTCAAA 


TGTTAGAGAC 


GATACCAGGT 


CTTGAAAAAG 


CAGATATGAT 


2160 


GCGTGCCGGC 


TACGCAATTG 


AATATGATGC 


GATTGTGCCA 


ACGCAGTTAT 


GGCCTACACT 


2220 


TGAAACGAAA 


ATGATTAAAA 


ACTTATATAC 


TGCAGGTCAA 


ATTAATGGTA 


CATCTGGTTA 


2280 


TGAAGAAGCA 


GCAGGACAAG 


GATTGATGGC 


AGGTATTAAC 


GCTGCAGGTA 


AAGTGTTAAA 


2340 


CACAGGCGAA 


AAGATATTAA 


GTCGTTCAGA 


TGCATATATT 


GGTGTCTTAA 


TCGATGATCT 


2400 


TGTAACTAAA 


GGTACTAATG 


AACCTTATCG 


TTTACTAACA 


TCACGTGCAG 


AATATCGTTT 


2460 


GTTAcTACGT 


CATGATAATG 


CTGATTTGAG 


ATTGACGGAT 


ATGGGATATG 


AACTTGGTAT 


252G 


GATTTCTGAA 


GAAAGATATG 


CACGTTTTAA 


TGAAAAACGT 


CAGCAAATTG 


ATGCGGAAAT 


2580 


TAAGCGTTTA 


TCAGATATTC 


GTATTAAACC 


AAACGAACAT 


ACGCAAGCGA 


TTATTGAACA 


2640 


ACATGGTGGT 


TCTCGCTTAA 


AAGATGGTAT 


TTTAGCTATC 


GATTTATTAC 


GCAGACCTGA 


2700 


AATGACTTAC 


GATATAATTT 


TAGAACTTTT 


AGAAGAAGAA 


CATCAATTGA 


ATGCAGATGT 


2760 


TGAAGAACAA 


GTAGAAATAC 


AAACAAAATA 


TGAAGGTTAT 


ATCAATAAAT 


CACTACAACA 


2820 


AGTTGAGAAA 


GTTAAGCGTA 


T 








2841 



(2) INFORMATION FOR SEQ ID NO: 178: 

35 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3025 base pairs 
T (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 178: 
ATCTAATTTC AAACCCGGTG ATAAATTGCC AAGCGTGACG CAATTAAAAG AACGTTATCA 60 
45 AGTAAGTAAG AGTACTATCA TTAAAGCATT AGGCTTATTG GAACAAGATG GTTTGATCTA 120 

TCAAGCACAA GGCAGTGGTA TTTATGTGAG AAATATTGCT GATGCCAATC GTATCAACGT 180 
CTTTAAGACT AATGGTTTCT CTAAAAGTTT AGGTGAACAC CGAATGACAA GTAAGGTACT 240 

SO 

TGTTTTTAAG GAGATTGCAA CGCCACCTAA ATCTGTACAA GATGAGCTCC AATTAAATGC 300 
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CGAATATTCT TATTATCATA AAGAAATCGT GAAATATTTA AATGATGATA TTGCTAAGGG 
CTCTATCTTC GACTATTTAG AATCAAACAT GAAACTTCGT ATTGGTTTTT CAGATATTTT 
CTTTAATGTA GATCAACTCA CTTCAAGTGA AGCTTCATTA CTACAATTGT CTACAGGTGA 
ACCATGTTTA CGTTACCACC AGACTTTTTA TACAATGACT GGCAAACCCT TTGATTCATC 
TGACATCGTA TTTCATTATC GTCATG CACA GTTTTATATT CCTAGTAAAA AGTAATAAAT 
ACATAAAAAC GTCTATATCC CAGTTATAAA CTGGAGTATA GACGTTTTTT TACGATAATA 
ACAATGGCTC AAATTGCTAT TATCTTGCTT AGGTTTTT CG TTTTAGAAGA ATATTGCTAC 
AAAGACAGGC ACAACTGCTA CAACAACTAC ACCAACTAAC ACTAAAGCTA TACTTGCCAT 
TGATTCTTCT ACAGGTCCTA ATTCTTTGGC TGGTGCTACA CCTAATGTGT GACCACTTGT 
TCCAAGTGCT AATCCTCGGG CAATAGGGTT AGTAATTCGG AAAAGCTTTA AGAATTTATT 



420 
480 

540 
600 
660 
720 
780 
840 
900 
960 

20 ACCTAGGGCA TAAATAATGA CACCATTTAA AATAACTGCT AATGATGTTA ATTCTTTTAT 1020 

ACCACCGATA CCAGCTGATA CTGGTAACGC AATCGCTGTA GTTGCTGCTT GAGGTAACAT 
TGATAAAATA ACATCATTGG CAAATTGTGC TAACTTCGCA AAAGTTAAAA TAATTAATAA 
25 CG CTACAACT GTACCGATAC CAATACCTCC GATGATACGA TGCCAATGTT TAACAAG CAC 

TTCACGCTTT TTATATAACG GAATCGCAAA ACAGATTGTT GCCGGTTCTA AGAAGAAGTA 
AATAATGTCT CCACCTATTT TGTAAGTCTT ATACGGAATG CCTGTTAAAT AGAGGAAGGC 
30 CACACCAAAT ACCATACTGA CAAATAGCGG TGCGAATAAG AAGAAACGAT TAGTTTTTTC 

AAATAATATG GTCGCTAAGA AAAATG GTAT AACGGATAAC AGTATTCCGA AGTAAGGTGT 
GTTTaGTGCT AAGTGGTTAA TCaTG AG CTT GTGCCTCCTC TATTTTGATC TTTTTTGTGA 
CTTTGTCACC TTTAGATCTC GAAGTAACTT TCATAATAAT TTgTGTGACA TAGCCAGTAC 156 0 

AAATRAGTAA TAGTATTGTT GAGACGATTA TTAGTCCAAT GATTAAAAAT GGTGCTTGGC 162 0 

TAATGACACC TAAAGAGTTA ACAACTGAGA TACCGGCTGG TACGAAGAGT AAGCCAATGT 
TATTTGTTAG TGTCGTTCCT ACTTTTTCGA CTTCGCCTAA CTTAACAGCA CCAGTACATA 
ATAATACAAA TAATAATACT AAACCGATTA CTGATGCAGG CATAGGAATT GGCATAAATG 
ATTCAATTAT TTTCGATACA AAGAGTACTA AAG CAATTAC AATGACTTGG TGAAAAAAGT 1860 
GTGCTGGTTT TGATGCGTCT TTTTGTTGTT TCACGACCAT TGCCTCCTAC GTTTGATTTA 1920 
ACTAAAGTAT AGATGGCTCA CTTCGATTTG CGTGATTTTT AGTCCGAAAT ACAAAAT AT C 198 0 

50 ATAGGTAAAA TGCATAAAAA AAAGGATTAC TGTTAAAGTA ATCCTATCGA CGCTTTAAAA 204 0 

TCTTTCATAA ATGAACGTCC AACTTGCATC TTGACAC CAT TTGTCAATAT TACCATATAA 2100 



55 



1080 
1140 
1200 
1260 
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TGAATACGTA TAAAATAAGT GGGATTCAAT CGTTTTTCAT AACGATTCAA TGGCTCTGTT 2220 

GTTTCGTATT TATGATTCGT TGTATGTATG GTTGTAATAC CATTATGTGT GCCAATCCCA 2280 

5 ATAATATTTT GTTGCTTTAA CATGTGAATT TTATCGTCAA TTTCAACAGG TAAGCTTTGA 234 0 

TCAAAATTCG CCGACATATC ATTCGCAATT GCACTTGCGT TATTATCATC TTTGGCTTTA 2400 

GTCGCACGCA CTTTATTGAC TGCTTGTTCA ATACGTTTTT GACCAAACGG TTTCAAAATA 2460 

JO 

TAGTCTGTCG CATTTAATTC AAATGCCTGT ACTG CGTATT GGTCATGTGC AGTTGCAAAA 2520 

ATAATCGCAG GTGGCTCTTT CATCTTTTGA ATCTTAGCTC CTAATTCGAT CCCATTTTCA 2580 

TCCATTAAAT TGACATCTAA AAATATAATG TCATATTGAT TGATCAGTAG TGCTTCCAAT 264 0 

15 

GTTTCTTTTA CATTTTCTGC CTCATTAATT TCTTCAAAAC CACCAATTTC ATTTAATAAA 2700 

TATGTTAATT CATTACGTGC TAATGGCTCA TCATCTATGA TTAATGCTTT CATATTTATT 2760 

CCTCCTCTTG TCTTTCATAA GGAAGTACAC ACCAAAAAGT GGTACCGCTC GATGTCGATT 2820 

20 

CAAATTGTAA TGCTGCGGAT TTTCCAAATA ATCCTTTTAG GCGTAAGTTT AAATTTTCTA 2880 

AAGCACTACC AGTTCCAGAC TCTGATTCTA CAGATGTnTC TCCCaACAAA TG CATTTT AT 2940 

25 CTTTAGAAAT ACCCTGACCA TTATCTTGTA CAATAATACG TACATGTGTf GCAGTTTCTT 3000 

TAATCACTGA CACGTCAATA TCGTT 3 025 
(2) INFORMATION FOR SEQ ID NO: 179: 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 168 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

35 

~<Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 179: 
ACAGAATTTC ACAGCATTTT TAGATGAAAA AATAAGCCAG TCATAGCGTT GATTTAACAA 60 
40 ATGAATATCA AAATTTAGTG GCTTTATATC AATAAAGGGT TTGTGAATAA TTGATACTAA 120 
ATCACTTTGC ATGTCATTTG TTTGTGTCAT AACTACAACT GGCTTCATAT TTAAACGTCA 180 
CTCCATTATT TAATGTTGTT CATTTAAGCG TTTTATAATT TCATAAGCAC CTTGCTCTTT 24 0 

45 

TAATTTGTTA CTCACTGTTT TGCCTAACTC AACCGGATCT GTTCCGTTCA TTGTATATTC 300 
AAATCGTTCT TTACCATCTG GGGTCATAAT TAAACCTGTA AATTCGATTT CGTTTTGATC 360 
TGAGATTGTA GCATATCCTG CAATTGGCAC CTGACAACTA CCATCCATTT CTGCTAAAAA 420 

SO 

CGTTCGTTCA GCAGTCACAC ATTTTGCAAC CTCATCATTA TGTACTTTGC TTAATAATGT 4 80 
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TAACAATGTA 


TCTCTATCAA 


GATAAGATGT 


TnCAATATCA 


TCTGACCAGC 


CCATTCTTCT 


600 




TAAACCAGCT 


GCAGCTAAAA 


TAATCGCATC 


ATAATCTTCA 


GTTTGTAACT 


TTTCTAATCG 


660 


5 


TGTATCTATA 


TTACCTCTAA 


TCCATTTAAT 


CTCTAAATTA 


GGATACTTAG 


ATAATATTTG 


720 




TGCACCACGA 


CGTAATGAAC 


TAGTACCAAT 


AATACTGCCT 


TCTGGCAATT 


GGGATAGTGG 


780 


70 


TGTATGTGTT 


TTAGAAATAT 


ACGCATCAAA 


AGGTAATTCT 


CTATCAGGGA 


TACAACCTAA 


840 




TGTTAAACCT 


TCCGGAATTA 


CACTTGGTAC 


GTCTTTAAGC 


GAGTGTATTG 


CCATATCGAT 


900 




ATTTTT1TCA 


AAAAGTTCAT 


GTTGTATTTC 


TTTAACAAAT 


AAGCCTTTGC 


CTCCGACTTT 


960 


75 


AGACAATTGT 


TTATCTACTA 


TACGATCGCC 


TTTCGTGaCA 


ATTTCTTTAA 


TTTCAATTTC 


1020 




TAGATTTGGC 


TCGACAGCTT 


TTAATTTATC 


AATAAATTGC 


TGGCTTTGTG 


TTAAAGCTAA 


1080 




TTTACyTCTT 


CTGGAGCCAA 


CGACTrATTT 


ACGCATGTTC 


AATTCCTCCT 


AGGAACGGAT 


1140 


20 


TGCTCTAGAT 


TATTTTCTCA 


ATTCACAAAA 


TGTGTTGCAA 


AAAATAAATT 


AATCATATTT 


1200 




AAGCAAAATA 


AAATAATGTT 


ATAGTATATT 


AAATATCTTG 


AATTCAACCA 


TTTGTTGATT 


1260 




CTAAGTAAAA 


TATAACTTCC 


ATATAATACT 


GTAATAATTG 


AAGAGAGTAT 


TACCTTCGGG 


1320 


2$ 


TCAATGAATA 


TACGTTCACC 


AACTGAAATT 


ACACCCCACT 


GTGTACCTAA 


AATAATACTA 


1380 




AATATGAGAA 


TTATCCACCC 


ACTTAACGTT 


GAGTAAAACA 


CAATTGATTC 


AAGTGTAGCA 


1440 




ACGCTACCAA 


TTCTAAAGTA 


TTTTTGATCA 


AAACGTTTTT 


CCTTCAAATT 


ACGGTATTGC 


1500 


30 


ATGATATACA 


GTAATGCATT 


GACAAAAGCT 


AAGGCAAAGA 


AGACATAACT 


TAACACAGCT 


1560 




AGACCGATAT 


GGACTAACAG 


TAACTCGTCT 


ACAACAGCAA 


TTTTCTGAAC 


CTTATTAGTA 


1620 




TAATGTGTCG 


GTTGAAATGT 


ATTCATCCCT 


AAnAGTGTTA 


ACCCTATTAA 


ATTCCAAGGA 


1680 


35 


AAAACACAG 












1689 



(2) -£ NFORMAT I ON FOR SEQ ID NO: 180: 

(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH : 1209 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 180: 
nTGGnTGGCT TTTCCTATTG GACCAAATGG ACCnTTTACC TGGCCnTTCC CAGGACACCC 60 
SO CGCTTGTGCC CACATTCCAA TCGGAAAAGG TGTATGTGGT ACAGCCGTTT CAGAACGTCG 120 

TACACAAATT GTAGCTGATG TTCATCAATT CGAAGGACAT ATCGCTTGTG ATGCTAATAG 180 
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CGATGCCCCT 


ATAACGGATC 


GATTTGATGA 


CAATGACAAa 


GAaCATCTTG 


AaGCAATTGT 


300 


TAAAATTATT 


GAAAaGCAAC 


TCGCATAAAA 


GGACATCAGC 


ATTTTCAATA 


AAGTGTTGAC 


360 


AGTTAGCAGG 


AAAATGTTAC 


AATAATCTTT 


GTGTGAATTA 


ACGAAAGTAG 


CAGTTGTATA 


420 


TTATTGAGCG 


CTATGTTGTT 


CCCAATGCGG 


ACGTGTCACG 


TAACTGTCGC 


TATAAGGTGA 


480 


AGACACATAA 


AACAATATAT 


CTTAGTAAGC 


ATG CAACACT 


CTTTTTTGTT 


TATTCATAAC 


540 


AACAAAAAAG 


AATTAAAGGA 


GGAGTCTTAT 


TATGGCTCGA 


TTCAGAGGTT 


CAAACTGGAA 


600 


AAAATCTCGT 


CGTTTAGGTA 


TCTCTTTAAG 


CGGTACTGGT 


AAAGAATTAG 


AAAAACGTCC 


660 


TTACGCACCA 


GGACAACATG 


GTCCAAACCA 


ACGTAAAAAA 


TTATCAGAAT 


ATGGTTTACA 


720 


ATTACGTGAA 


AAACAAAAAT 


TACGTTACTT 


ATATGGAATG 


ACTGAAAGAC 


AATTCCGTAA 


780 


CACATTTGAC 


ATCGCTGGTA 


AAAAATTCGG 


TGTACACGGT 


GAAAACTTCA 


TGATCTTATT 


840 


AGCAAGTCGT 


TTAGACG CTG 


TTGTTTATTC 


ATTAGGTTTA 


GCTCGTACTC 


GTCGTCAAGC 


900 


ACGTCAATTA 


GTTAACCACG 


GTCATATCTT 


AGTAGATGGT 


AAACGTGTTG 


ATATTCCATC 


960 


TTATTCTGTT 


AAACCTGGTC 


AAACAATTTC 


AGTTCGTGAA 


AAATCTCAAA 


AATTAAAPAT 




CATCGTTGAA 


TCAGTTGAAA 


TCAACAATTT 


CGTACCTGAG 


TACTTAAACT 


TTGATGCTGA 


1080 


CAG CTT AACT 


GGTACTTTCG 


TACGTTTACC 


AGAACGTAGC 


GAATTACCTG 


CTGAAATTAA 


1140 


CGAACAATTA 


ATCCGTTGAG 


TACTACTCAA 


GATAATACGG 


TCAATACCAA 


CACCCACAAT 


1200 


TGTGGGTGT 












1209 



(2) INFORMATION FOR SEQ ID NO: 181: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 698 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 181: 

AAATCCCTTt GTtaAAgTsC AAACTTTTCc AACrgCTTTA AtArGACCCA TATTACC t TC 60 

TTGGATTAAA tCmAGGaATG AcATACCACG ACCaCGTATC TTTTAGCAAT ACTTACAACT 120 

AAACGTAAGT TCGCTTCTGC AAGTCTTGAT TTTGCTACTT CATCACCTTG TTCAATACGT 180 

TTGGCTAATT CGATTTCTTC TTGTGCACTT AATAAGTTAA CACGCCCAAT TTCTTTAAGG 240 

TACATACGAA CTGGGTCATT TATTTTAACA CCTGGAGGGG CACTAAGATC ACTTGGATTC 300 

AGTTTCTCGT CAGTATCTGA ACTATCTTTT TCATTAACTA GTGAAATATC ATTATCATTT 360 
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GCAATTTCTT CATGACTTAA ATGACCCTCT TTTTTACCTT TTTCAATTAA TTGCTTCTTA 4 80 

ACATCTTCTA ATGTTAATGT CGGATCAATT GTTTGTTTTT TAATTTTAAC TGTGTTATCA 540 

GACATGAAAC GGCCTCCCGA TTTTAAATAT GAACATTCGA AATTTATTCA ATATTGCTAT 600 

TTTAAACGAA ATTCTTAATT AATTCCATCC ATATTTTnAA TTTTATTTTA CAAATTGGGA 660 

ACTAAATCCC CAATATTTAT TTTTCAATAG TGGTGGTT 698 
(2) INFORMATION FOR SEQ ID NO: 182: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5147 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



20 <*i) SEQUENCE DESCRIPTION: SEQ ID NO: 182: 

ACTTGATGAT GTATACAATG TATTTCAAGA ATATTATCAA AAAACATCTA ACATTAAGTT 60 

TTGTAGAATT CACAATTCTA GCTATTATCA CTTCTCAAAA TAAAAACATC GTTCTTCTTA 120 

25 AAGATTTAAT TGAAACAATC CACCATAAAT ACCCTCAAAC TGTTAGAGCT CTCAATAATT 180 

TAAAAAAGCA AGGCTATCTA ATAAAAGAAC GCTCAACTGA AGATGAAAGA AAAATTTTAA 24 0 

TTCATATGGA TGACGCGCAG CAAGACCATG CTGAACAATT ATTAGCTCAA GTGAATCAAT 300 

TATTAGCAGA TAAAGATCAT TTACATCTTG TTTTTGAATA ATATCTCTAT TACGCAAGTG 360 
TGCTGTATTC TAAAGTGCAC TTGTGTTTTC TATTTTTTAA TAAAACCTCA GCACATAATG ' 42 0 

AACAACTTTC TATTTTCTAT ATCACTTAAA ACCATTTCCG AAATTAAACC TCAG CACATT 48 0 

CAAAGCCCCA CTTTATTCTT AAAAATATTT TTTAACTCAT ATGTATTAAA CCGCTTTCAT 54 0 

TATAAAAAAT ATCTCTATAT TtTATCTGtT TtTATTAATC GAAATAGCGT GATTTTGCGG 600 

TTTTAAGCCT TTTACTTCCT GAATAAATCT TTCAGCAAAA TATTTATTTT ATAAGTTGTA 66 0 

AAACTTACCT TTAAATTTAA TTATAAATAT AGATTTTAGT ATTGCAATAC ATAATTCGTT 720 

ATATTATGAT GACTTTACAA ATACATACAG GGGGTATTAA TkTGAAAAAG AAAAACATtT 78 0 

ATTCAATTCG TAAACTAGGT GTAGGTATtG CATCTGTAAC TTTAGGTACA TTACTTATAT 84 0 

CTGGTGGCGT AACACCTGCT GCAAAtgctG CGCAACACGA TGAAGCTCAA CAAAATGCTT 900 

TTTAT CAAGT CTTAAATATG CCTAACTTAA ATGCTGATCA ACGCAATGGT TTTATCCAAA 960 

GCCTTAAAGA TGATCCAAGC CAAAGTGCTA ACGTTTTAGG TGAAGCTCAA AAACTTAATG 1020 

ACTCTCAAGC TCCAAAAGCT GATGCGCAAC AAAATAACTT CAACAAAGAT CAACAAAGCG 1080 
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AAAGTCTTAA AGACGACCCA AGCCAAAGCA CTAACGTTTT AGGTGAAGCT AAAAAATTAA 1200 

ACGAATCTCA AG CAC CG AAA GCTGATAACA ATTTCAACAA AGAACAACAA AATGCTTTCT 12 60 

ATGAAATCTT GAATATG CCT AACTTAAACG AAGAACAACG CAATGGTTTC ATCCAAAGCT 1320 

TAAAAGATGA CCCAAGCCAA AGTGCTAACC TATTGTCAGA AGCTAAAAAG TTAAATGAAT 13 80 

CTCAAGCACC GAAAGCGGAT AACAAATTCA ACAAAGAACA ACAAAATGCT TTCTATGAAA 14 4 0 

TCTTACATTT ACCTAACTTA AACGAAGAAC AACGGAATGG TTTCATCCAA AGCCTAAAAG 1500 

ATGACC CAAG CCAAAGCGCT AACCTTTTAG CAGAAGCTAA AAAGCTAAAT GATGCTCAAG 1560 

CACCAAAAGC TGACAACAAA TTCAACAAAG AACAACAAAA TGC'TTT CT AT GAAATTTTAC 1620 

ATTTACCTAA CTTAACTGAA GAACAACGTA ACGGCTTCAT CCAAAGCCTT AAAGACGATC 1680 

CTTCAGTGAG CAAAGAAATT TT AG CAG AAG CTAAAAAGCT AAACGATGCT CAAG CAC CAA 174 0 

AAGAGGAAGA CAATAACAAG CCTGGCAAAG AAGACAATAA CAAGCCTGGC AAAGAAGACA 1800 

ACAACAAGCC TGGTAAAGAA GACAACAACA AGCCTGGTAA AGAAGACAAC AACAAGCCTG 1860 

GCAAAGAAGA CGGCAACAAG CCTGGTAAAG AAGACAACAA AAAACCTGGT AAAGAAGATG 1920 

2S GCAACAAGCC TGGTAAAGAA GACAACAAAA AACCTGGTAA AGAAGACGGC AACAAGCCTG 1980 

GCAAAGAAGA TGGCAACAAA CCTGGTAAAG AAGATGGTAA CGGAGTACAT GTCGTTAAAC 204 0 

CTGGTGATAC AGTAAATGAC ATTGCAAAAG CAAACGGCAC TACTGCTGAC AAAATTGCTG 2100 

30 CAGATAACAA ATTAGCTGAT AAAAACATGA TCAAACCTGG TCAAGAACTT GTTGTTGATA 216 0 

AGAAGCAACC AGCAAACCAT GCAGATGCTA ACAAAGCTCA AGCATTACCA GAAACTGGTG 2220 

AAGAAAATCC ATTCATCGGT ACAACTGTAT TTGGTGGATT ATCATTAGCC TTAGGTGCAG 22 8 0 

35 CGTTATTAGC TGGACGTCGT CGCGAACTAT AAAAACAAAC AATACACAAC GATAGATATC 234 0 

ATTTTATCCA AACCAATTTT AACTTATATA CGTTGATTAA CACATTCTTA TTTGAAATGA 24 00 

TAAGAATCAT CTAAATGCAC GAGCAACATC TTTTGTTGCT CAGTGCATTT TTTATTTTAC 2460 

TTACTTTTCT AAACAACTTC TGAAACGCCT CAACACTTTC TACTCTGATT ACATATATGA 2520 

CATTTTTAGG CATTAAAAAA TCGAACTAGA CAAGATGCTC ATTGCATTTC GTACT AGTTC 2580 

GATTCATGAA TAATTAGATT TAAAATGTCA TTTGAATCCA AGTGACAACA TTATTTATAT 264 0 

TTAGAATATT AACGTTAGTA TAAACGTCCA AACACAAATA AAAGCAACAA ATATAATACT 2700 

GTATTTTAAC GTCATTTTTA ATAATGCAGA TTCTTCACCA ACTTTTTTAA CAGCTGCAGT 2760 

CGCAATGGCA ATTGATTGTG GTGAAATAAG TTTCGCTGCT ACACCACCTG CAGTGTTAGC 282 0 

TGCCACAAGT AATGAACCGC TTGTTGAAAT TTGTTGTGCC ACTGTCGCTT GAATAGGTGC 28 80 
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TGGAGAGAAT AATGGGAAAA TTGCTCCCGC TTTAGCAATA CCTTGTCCAA TTGCTACAGT 3000 

CAAACCACCG TATGTCATAA CTTTAGCAAT AGCTAGGATA GCTGAAATTG TAAGGATCGG 3060 

TAACCATAAT TCTTTAATTG CTTCGACCAA TAAAGCACCT GCACTTTTCC ATTTTAACTT 3120 

CGTAATTAAA ATTGTAATAA TTACTGTTAA TAAAATCGCT GTCCCAGTTG CACCAATTAA 3180 

ATCGAGACGC AACGCAATTC CTTTAGGCGA TAAATCACTC ACAGTATTTG GAATTGGCAA 3240 

TTTTATTACT AAACTTTCAA GTGCACCTCC AGGTTGGAAT AATTTTTTGA AGAATGGTGC 33 00 

ACTCCATACT AATACAAAGG CAGTTAAAAT TACGAACGGA CTCCAAGCAA AGACAATTTC 3 3 60 

TTTAGGCGTT CGTTTTTGAA TTTTATGTTC AGACGCTTCC AATCTGAAAA TGTTTTTCGG 3420 

TTTAAATTTA CGACAAACAA ATGCTAACAC CACCATTGTT GCTAGTGATG GAATAATGTC 3480 

TGCTAGTTCT GGACCATGGA ATATTGTTAA TAATAATTGT AATCCAGTAT ATGTACCACT 3 54 0 

20 CACTGTTAAA ATGACAGGTA AAATTTCTTT AATACCTTTC ATACCATCTA CAATGAATAC 3 600 

TAAAACAAAT GGAATAATAA AGTTTAAAAT TGGAAGTGTT AATGCTGAGT ATCTCGCAAC 3660 

ATCTAATGTT GTAACGCCTC CACTTAAGTT AAACGTATCA ATAATACTAA CTGGTAAACC 3720 

AATTGCACCA AAGGCACCCG C CG CACCATT AGCAATTAAA CATAACATCG CTGCTTTTAA 3780 

TGGTTCAAAT CCAAGTTGAA TTAATAATAC TGCACAAATC GCAATTGGCA CACCAAATCC 3840 

TGCTGCACCT TCTAAAAATG CGTTGAAACA AAATCCAATT AATAATAGTT GGATTCTTTG 3 90 0 

GTCCACTGAA ATACTTGCAA TACTATCTTG AATAATAGAA AATTGTCCTG TTTTAATAGA 3 960 

AACTTTATAT AACCAAACTG CCATTAAAAC GATATATCCT ATTGGGAAAA TACCGGCAAC 4020 

35 AACGCCTTCT GTAATCGCAC CTGCTGATAC ACGCGCTGGT AATTCAAATA CAAATAAAGC 4080 

CACAATCAAT GTAACAACCA AAGTTGTCAA TGCTGCATAA ATGCCTTTCA TTTTAAAAAC 414 0 

GGTT^AGCAT AATAAAAATA AAATAATAGG TACTGCTGCA ACTAAGGCTG ATAATCCGAC 4200 

40 ATTATCGAAT GGATTTACAG TAAGTAGTGT CATAATGACT CCCTCTCTTT ATATAAAATA 4260 

TTTATCATTC TGATTAATCT ACAACCTATT TCAACTTATA TTTTGCGATG ATCACATATT 4320 

TAAAATGTAA CACTCCTATA TGTGACAGGC AATCGAATTT TTACAAAAAG TTCACAAAAT 43 80 

ATACACAATA TTTAACTATA ATAmATAATA TATCaTntTA ATTATAAATA CTAGATATTA 4440 

TTTATAATAA TCTCAGGAAT TCGCTTCAAA ACTGCATCAT GAGAGTTTAT ATTTTTATTG 45 00 

AGAATCTCTC ATTTTATGAA TTGTAGGAAG TAAACAAAAT ATGACAAGCG TCAAACCAAT 4 560 

GATAATGATA AATATCATAT TAAACCATAG TAAATTGAAT TGATGATGGT GTTGTATTTG 46 20 

CCAAATTTCT AATACTGTGA AGATAGACAT ATAGCTCATA ATCTCTAAAT TTAACGTACT 4 6 80 
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AAATCGTTCA TAGTATCTAC CTGCAATGAA AAATATAAGC CAAATCACTA TAAATGCGCT " 4800 

ATTAATCAAA AGCAGCACCC ATTTATCAGC AAAATTATCA GCATCCCCTG CTAAATTATA 4 86 0 

ATGAATAGGC ACTTTGGTTG GTAATTTTGG ATAGGTCACT ACTGTATAGC ACATCATAGC 4 920 

TAAGTAAATA AGTAGACTTA ATATTGTAAA AGACCTGATT TTAGACATTC TATCGCCTcT 4 980 

TcTTTACATT TTATGTATAA CACTCTGCCT ATTTTACCTT TTAATaCATT ACCCCAAcGA 504 0 

TtAAaCAATA tGTAaTGATA CTATAATTGC GTCAGGAGTA TCCGCTTGTT AAATGTGCAT 510 0 

AG CTT AT ATT TAGCTGTTTA ACATGCCACA TAATGATTCG AATTATT 514 7 
(2) INFORMATION FOR SEQ ID NO: 183: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1312 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
20 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 183: 

CACTTACTTC CACCATTATC ATAACTTTAA AATGGATATA nTTCATCAAA CATTATCTAA 6 0 

AGGCGTCGCA CCTACACCAA CACCATCCAA CAATTAACTT ACAACTCTGC GATTACTTCT 120 

TCAGCAGCAA CTTTCACnTG CGTAATACAA TCAGGTAGTC CAACCGCTTC AAAAGATGCA 180 

CCAGTTACTC TAAGTCGTGG ATATGTTTGT TTAATATGTG CTTGAATCTG TCTAATTTGT 24 0 

TGAATATGAC CGACATGGTA CTGTGGCATA CTTTTCGGCA AACGATTGAC AATTGTAAAT 3 00 

55 TCAGGATCAC CTTTAAATGT CATCATTTGA CTTAAATCTC TACGTACAAT CGATACTAAT 360 

TCATTATCTG TATGATCATC AAC CACAGTA TCACCTGGTT TACCTACATA CGCACGAATC 420 

AAAACCTTAC CTTCCGGTGT AGTAAATGGC CATTTTTTCG ATGTCCAAGT ACATGCGGTA 4 80 

ATGTCTGTAT CACTCGTTCT CGCAATTACG AAGCCAGTAC CATCATGGGT ATTTTCAATG 54 0 

TCTTTTTCAT CAAATGCCAA TACAACAGTT GCAACAGTCG TACTATCCAT CGTTTTAAAG 6 00 

TAATCAAATG CTGGATCTTG TCCGAACCAA TTTAAAAACA CTTGATGTGG TGTCGTTACT 660 

AATACGC CAT CATACACTTC TTCTAGTTGA TCATTGTAAA CAATTTTATA TTGTTTTTGA 72 0 

GATGTAATTA TATCATCCAC TGACGTATTG TAGCGTATTG TCACACCTTT ATTTTTAACA 780 

TCTTGTTCTA ATGCTTCAAT AAATGAGCTT AAACCATGCT TAAATTGTTT GAATTGTCCT 84 0 

TTCGGTGCGC CAGGATATAA TTGTCTTTGT TTCAGACGCT TATTTTTCTC ATCCTTCATA 900 

CCTTTTATCA GACTTCCGAA TGCCTCTTCT TTTTCTTTAA AATTAGGAAA CGTACTCATC 960 
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TCAAGTACCT CATTACCTAA TCTTGCTCTG AAAAATGCAC CAACAGAAAT GTCACCATCC * i 0 80 

TGCATTTGAG TAGGTTTTTT TAATAAATCA AACCCTGCTC TTAATTT AC C AAGTGG CGAT 1140 

ATTAATTTTG TAGTAACAAA TGGTTTAATA TCTGTTGGAA TACCCATAAT TGAACCACCT 1200 

GGAATCGGAT ATAATTTATT TTTCGCAAAA ATATATGATT GTCCAGTCGT ATTTGTAACA 1260 

ATATCTTGTT CTAATCCAAT ATCTTTCGCT AATTCTGTCA TAATCGTTTT TC 1312 



W 

(2) INFORMATION FOR SEQ ID NO: 184: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 6157 base pairs 
15 (B) TYPE; nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 (xri) SEQUENCE DESCRIPTION: SEQ ID NO: 184: 

TTTTACAATA AAAATATGAT ATACTACTTG TCGTATATAA GGAACGGAGG ACAATTTATG 6 0 

CATACATTTT TAATCGTATT ATTAATCATT GATTGTATTG CATTAATAAC TGTTGTACTA 120 

25 

CTC CAAGAAG GTAAAAGCAG TGGACTTTCA GGTGCCATCA GTGGTGGTGC TGAGCAGTTA 180 

TTCGGTAAAC AAAAACAACG TGGCGTCGAT TTATTCTTAA ATAGATTAAC AATTATTTTA 240 

TCAATATTAT TTTTTGTACT TATGATTTGC AT AAGTT AT C TTGGTATGTA AGGTCCGGCG 300 

30 

ATGTAAATGT CGGG CTTTTT TATTTATAAT TAAGAATGTA ATAGTTTAAC AATAAGCTAT 3 60 

GTAAAATATA TAGCCTAGTT AAGTATGCAA AGGGAGCGTT AGATTTATGC AGATAAAATT 420 

35 ACCAAAACCT TTCTTTTTTG AGGAAGGTAA ACGTGCCGTG TTATTACTAC ATGGTTTTAC 480 

AGGCAATTCG TCTGATGTTC GTCAATTAGG TCGATTTTTA CAAAAGAAAG GTT AT ACAT C 54 0 

ATATDCACCG CAATATGAAG GCCACGCGGC ACCACCAGAT GAAATACTGA AATCTAGTCC 600 

40 TTTCGTTTGG TTTAAAGATG CGTTAGATGG TTATGATTAT CTTGTTGAAC AAGGTTATGA 660 

TGAAATTGTT GTTGCTGGTC TATCATTAGG TGGGGATTTT GCTTTAAAAT TAAGCTTAAA 720 

TAGAGATGTA AAGGGTATTG TAACGATGTG TGCTCCTATG GGTGGCAAAA CTGAAGGTGC 780 

45 

CATTTATGAA GGCTTTTTAG AATATGCACG CAATTTTAAA AAGTATGAAG GTAAAGATCA 840 

AGAGACTATT GATAATGAAA TGGATCATTT TAAACCAACT GAAACTTTAA AAGAACTAAG 900 

50 TGAAGCATTA GATACGATTA AAGAGCAAGT TGATGAAGTG TTGGATCCTA TTTTAGTGAT 960 

TCAAGCAGAA AACGACAATA TGATTGATCC ACAATCCGCA AATTATATAT ATGACCATGT 1020 

AGATTCTGAT GACAAAAATA TCAAGTGGTA CAGTGAATCT GGACATGTTA TTACGATTGA 1080 

55 
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AGAATAAAAA 


GAGATTTTAA 


CATTAGAAAG 


GAGGGGCATA 


ATGAATTTAA 


AGCAATCTAT 


1200 




AGAAGAGATT 


ATTAATCAAC 


CTGAATATGA 


ACCTATGTCA 


GTGTCAGATT 


TTCAAGATGC 


1260 


5 


ATTAGGTTTA 


AGCAGTGCCG 


ACTCGTTTAG 


AGATTTAATT 


AAGGTGCTTG 


TGGAGTTAGA 


1320 




ACAATCAGGA 


TTAATCGAAC 


GTACAAAAAC 


AGACAGATAC 


CAAAAAAAGC 


ATAGTTATAG 


1380 


m 
1U 


AGGTCAATCA 


AAATTGATAA 


AAGGAACGTT 


AAGTCAAAAT 


AAAAAAGGCT 


TTGCATTCTT 


1440 


AAGACCTGAA 


GATGAGGATA 


TGGAAGATAT 


ATTTATTCCC 


CCGACGAAAA 


TTAATCGTGC 


1500 




CTTGGATGGA 


GATACTGTTA 


TTGTAGAAAT 


CCATCAATCA 


AAAGGTGAAC 


ATAAAGGTAA 


1560 


15 


AATCGAAGGG 


GAAGTTAAGT 


CGATTGAGAA 


GCATTCTGTA 


ACTCAAGTTG 


TTGGTACGTA 


1620 




TAGTGAAGCT 


AGACATTTTG 


GCTTTGTTAT 


TC CGGATG AT 


AAACGTATTA 


TGCAAGATAT 


1680 




TTTCATTCCT 


AAAGGTCAAA 


GTTTAGGCGC 


AGTCGATGGT 


CATAAGGTAC 


TTGTACAAAT 


1740 


20 


TACTAAGTAT 


GCTGATGGTT 


CAGATAATCC 


AGAAGGACAT 


ATTTCTGCTA 


TTTTAGGACA 


1800 




TAAAAATGAT 


CCTGGCGTAG 


ATATTTTATC 


TATTATCTAT 


CAACATGGCA 


TAGAAATTGA 


1860 




ATTTCCTGAT 


GAAGTGTTAC 


AAGAAGCTGA 


AGCAGTACCT 


GATCATATTG 


AAAATACTGA 


1920 


25 


AATTAAAGGC 


CGTCATGATT 


TACGTGATGA 


ATTGACAATC 


ACAATTGATG 


GTGCTGATGC 


1980 




TAAAGACTTA 


GATGACGCAA 


TTAGTGTTAA 


AAAGTTAGCG 


AACGGTAATA 


CGCAATTAAC 


2040 


30 


TGTAAGTATT 


GCTGATGTCA 


GCTATTATGT 


AACAGAAGGT 


TCTGCATTGG 


ATAAAGAGGC 


2100 


ATATGATAGA 


GCGACAAGTG 


TATATCTTGT 


TGACCGTGTA 


ATTCCAATGA 


TTCCACATCG 


2160 




ATTAAGTAAT 


GGTATTTGTT 


CATTGAATCC 


TAATGTTGAT 


CGTTTAACTC 


TAAGCTGTCG 


2220 


35 


CATGGAAATC 


GATGCTAGTG 


GTCGCGTTGT 


TAAACATGAA 


ATTTTTGATA 


GTGTTATACA 


2280 




TTCTGATTAT 


CGAATGACGT 


ATGATGCGGT 


AAATCAGATT 


ATTACTGAAA 


AGGATCCTAA 


2340 




CATTCGCGAA 


CAATATAATG 


AAATTACGCC 


TATGCTAGAT 


TTAGCACAAG 


ATTTATCTAA 


2400 


40 


TCGTTTGATT 


CAAATGAGAA 


AACGACGTGG 


TGAAATCGAT 


TTTGATATTA 


GTGAAGCAAA 


2460 




AGTATTAGTT 


AACGAAGACG 


GTATACCAAC 


AGATGTTCAA 


TTAAGACAAC 


GTGGCGAGGG 


2520 


45 


TGAACGTCTA 


ATTGAATCAT 


TTATGTTAAT 


TGCAAATGAA 


ACAGTTGCTG 


AACATTTTAG 


2580 


TAAGTTAGAT 


GTACCTTTTA 


TTTACCGAGT 


GCATGAGCAA 


CCTAAATCAG 


ATCGCTTAAG 


2640 




ACAATTCTTT 


GATTTTATTA 


CAAACTTTGG 


CATCATGATT 


AAGGGTACTG 


GCGAAGATAT 


2700 


SO 


TCATCCAACA 


ACACTTCAAA 


AGGTTCAAGA 


AGAAGTAGAA 


GGTCGACCTG 


AACAAATGGT 


2760 




CATTTCAACA 


ATGATGTTGC 


GTTCAATGCA 


ACAAGCGCAT 


TATGATGATG 


TGAACTTGGG 


2820 




ACATTTTGGC 


TTATCAGCTG 


AATATTATAC 


GCATTTTACA 


TCACCAATTA 


GACGTTATCC 


2880 



55 
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AGAAGTGAAG CGTTGGGAAG ACAAATTGCC 
ACGTCGTGCT ATTGAGGCAG AACGTGATAC 
5 TCAACATATT GGTGATGAAT TTGAAGGTAT 

CATTGAATTG CCAAATACGA TAGAAGGTAT 
TTACCGTTTT GAAGAGCGTC AAATGGCATT 

10 

AATTGGTGAC ACAGTTAAGG TTAAAGTGAC 
TTTTCAAATT GTAGGTATGC CTTTACCGAA 
TAAGACAATT CAAGCCAAAA CGCGTGGTAA 
GGGTCGTAAG AAAAAAGGTA AGCAACGTAA 
AGGTAATAGT AAGCATAAGC CATTTTATAA 

20 TAAGAAAAAA TAAGCAGCAA TGAGGTGAGT 

ATTAGCGGAA AATCGTAAGG CAAGACATGA 
AATTGTATTG CAAGGCACAG AAATAAAATC 

25 TAGTTATGCG CAAGTTAAAA ACGGTGAAAT 

CGAAGAAGGG AATCGTTTTA ATCACGATCC 
GCGTGAAATC ATTAAATTGG GTGATCAAAC 

30 

AAAGCTTTAT TTGAAGCATG GACATTGTAA 
AAAATATGAT AAACGTCAAG CTTTGAAAGA 
TATGAAAGCC CGTTATTAAG CGATTTAGTT 

35 

ATGTGCTTTT GTAAATTACA AAAGTATGAT 
TGGA3TCGAC AGGGGTCCCC CGAGCTCATT 
40 ACACACACAG TTTATAATAA CTGGCAAATC 

G<^CTCTGCA TCGCCTAACA GCATTTCCTA 
GATATGCTAA ACACTGCCGT TTGAAGTCTG 

45 

TGTTGGTTGT TTATCACTTT TCATGATGCG 
GATGTGTATC AGGACCTTTG GACGCGGGTT 
ACAGCCTTTG TGGTTGTGGG CTTTTTTATT 

SO 

AATTTGTTGT GAGTATTGAT ATAGCAGTGT 
AGTAATAAGT GATTATGAAT TAGTTTTTGA 

55 
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TGAGTTAGCT GAACATACTT CTAAACGTGA ~ 3000 

TGATGaATTG AAAAAAGCAG AATATATGAT 3 060 

TGTCAGCTCA GTAGCTAACT TCGGTATGTT 3120 

GGTTCATATT GCGAATATGA CTGATGATTA 3180 

AATTGGTGAG CGTCAAGCTA AAGTATTTAG 324 0 

G CATGTTG AT GTAGATGAAC GATTAATTGA 3 3 00 

AAATGATCGA TCACAGCGCC CAGCGCGAGG 3 36 0 

ATCATTAGAT AAATCAAAAT CTGATGATAA 3420 

AGGTAAAAAC CAACGTAATA ATGATAAATC 3480 

AGATAAAAGT GTGAAAAAGA AAGCACGTCG 3540 

ATGAATGGCT AAGAAGAAAT CACCAGGTAC 3600 

TTATAATATT GAAGATACGA TTGAAGCGGG 3660 

AATTCGCCGA GGTAGTGCTA ACCTTAAAGA 3720 

GTATTTGAAT AATATGCATA TAGCACCATA 3780 

TCTTCGTTCT CGAAAATTAT TATTGCACAA 384 0 

ACGTGAGATT GGTTATTCGA TTGTGCCGTT 3900 

AGTATTACTT GGTGTtGCAC GAGGTAAGAA 3 960 

AAAAGCAGTC AAACGAGATG TTGCGCGCGA 4020 

GCTTAATCGG GCTATATTTG ATATAGTTAT 4 080 

TTGTTTGATT TATTATTTCG GGGACGTTCA 4140 

AAGCGTGTCG GAGGGTTGTC TTCGTCATCA 4200 

AAACAATAAT TTCGCAGTAG CTGCCTAATC 4 260 

TGTGCTGTTA ACGCGATTCA ACCTTAATAG 4320 

TTTAGAAGAA ACTTAATCAA ACTAGCATCA 4380 

AAAC CTATCG ATAAACTACA CACGTAGAAA 4440 

CAAATCCCGC CGTCTC CAT A TTTGTAGCCT 4500 

TTGTGTTTTT CAGGGGATAA TGCATTGCAG 4560 

TTGTATAGGT GTTTATTTGA TGGAGGAAAG 4 620 

GATATAAGGG GACAGTGATG TGTGTCAAAT 4680 
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TTATACGCAA AAAATTCTCC ATGTTATATA TGTCAATATA AAAATGTGAA TCGTCTACAC 4 800 

TTAATTGGAT AAATGGCTAC TGAAAAAGAA CTTTTCATTT TTGTTACGTC ACTAAGTGGG 4 860 

TGTAGTTATA AAGAGATGAG CCGAGTTTTG ATATTTTCAT TAGAATCAAT ATGCCTATTA 4 920 

ACACAATCAG CAATAGTTGA CGAGACGGAA ATAAAAGAAG TCGTAGTTAA GAAATGCATT 4 980 

T CACAACAT A CCATTGTAGC CATTTTTATT GTTTTGGATG ATAAACTCTT TTTGGAATTT 504 0 

TTAGTTTTTA TAATTTGCAA CTACACTACT TCTTTTACTA ATATTAATGT CTAAGTAATC 5100 

GATAAAAAAT TTTCCATTGA ATAAATGAGA AGTTAAAAAC TTTACTTAAC CTTTCycATT 5160 

GCATTTTCCT ATTCACGATT TTAAGAACCC AACATACTAC AAACGAATTT TAAAAGGCGA 5220 

GAGTAAAGCT TACTTGTTTA TTATACATAT TTAAAATCCA AGAGTCAGAA CAGACTACTC 5280 

CTCTTTATAA CTATAAAAAA TAGCTATGAA AAAATCTATC GTCATAGATT CCTTCATAGC 534 0 

20 TAATCTTAGT ATGTTTATTT TTATTTTAGG ATGCTATTTA TCAACTCAAC ATATAACTCA 5400 

CTATTTTTAT AACCTTCTAA TATATCATTA ACTTGTCTAA TAGGTATTTC TGGTACTTCT 5460 

CTAATGTTTT CCAATTTTGT TTTAAATTGT TTTTTTGTTA TTTGCTCTTT ATTTGTAGCC 5520 

AATTGGAACA AGTAAGAATC TAGCATATTA ATTTCTTTAT ATGAATACAT ATATCTTAAT 5580 

AACACTAAAT CTCTAGTTTT TAAGTTAGGC GCTAGTTCTT CTTGTAATTG TTCTATTGAT 5640 

TGTyTCATTA ATAACAATCT CATTTCTAAT TCTTCATTAT TCATTTT AT C ACACTCTT t T 5700 

TATATTAATG CTTGACCAAC TTGGGAAACC CAAAACCCTA TGCTTCTTGC AGTAGAATCT 5760 

TTAATACCAG TTCCCATCAA TGCTTGTGAA ACTTGACCTT GTACATTTCC CCATGTAGCC 582 0 

TCTTCTTGTT TTAATGCATT ATTCAATGCG GGATTTACAA ATTTATCCCA TCTTTTTTTT 5880 

ATGATTTTCC GGCACGGGGA CTGATTTCTT TAACACCATT AAACACAGAT TTTTTATTTT 5940 

TAATCATAGC TTTATAGTAT CATGTTGGCT AAGCTATAAA TAAGTCAGTT TCTCTAAAAA 6000 

40 TTAAATAACT GAATGTAAGA CAATCAACAA wCCAAATTTA TACTTCATCT AAACCACTGT 6060 

GGTCGTCATC TTTTTGCTTT TCTTTTTCTT TCTCTCGTTC TTGTTCTTTT TTGTACTCTT 6120 

CTTCAAATTC TTTTTCTTTC TTTTCTACTT CTTCTCT 6157 

45 

(2) INFORMATION FOR SEQ ID NO: 185: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 884 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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v_r\X X IVjI inl 




CaATTTGGCA 


AAGATGAACA 


AACGTCTGAA 


CAAACGTATC 


60 




A AnTTnPA^T 

X X OvAu X 


V-Vj 1 — Al X ALjACj 


TT AATT CAT A 


TGGCAACACT 


TGTTCATGAT 


GACGTTATTG 


120 


5 


ATAAAAHPfiA 




TV TV r**TT* TV * 

GCjCAAG l l AA 


CCATATCAAA 


GAAATGGGAT 


CAGACAACTG 


180 




L1M1 X X X AMv- 


XurViOAAl 111 


TTATTGG CAT 


TAGGACTTGA 


ACACTTAATG 


GCCGTTAAAG 


240 


10 


r\ X e\n X X L» X 


Ai-A I LAA 1 XXj 


ATATCTGAAT 


^#t»tv m/i/^mifi/^ ik 

CTATCGTTGA 


TGTTTGTAGA 


GGGGAACTTT 


300 






7A TV /"* TV TV TV /■» 

aacagtcaac 


H % ft ft mM ft #w% 

AGACAATTAT 


TAATTATTTA 


CGACGTATCA 


360 




B-TV^f^f^R MAP 
A X 


ACjLALTGTTA 


ATT CAAAT AT 


CAACTGAAGT 


TGGTGCAATT 


ACTTCTCAAT 


420 


15 


1 Vj A X AAAbA 




TV TV T\ 'T"l '/"** TV IV IV IV 

AAATTGAAAA 


TGATTGGTCA 


TTATATAGGT 


ATGAGCTTCC 


480 




AAAiUAl TGA 


TGATGTATTA 


GACTTCACAA 


GTACCGAAAA 


GAAATTAGGT 


AAGCCGGTCG 


540 




t» AAvj 1 1» A 111 


GCTTAATGGT 


CATATTACGT 


TACCGATtTT 


ATTAGAAATG 


CGTAAAAATC 


600 


20 


CAGACTTCAA 


ATTGAAAATC 


GAACAGTTAC 


GTCGTGATAG 


TGAACGCAAA 


GAATTTGAAG 


£60 




AATGTATCCA 


AATCATTAGA 


AAATCTGACA 


GCATCGATGA 


GGCTAAGGCA 


GTAAGTTCGA 


720 




AGTATTTAAG 


TAAAGCyTTG 


AATTTGATTT 


CyGaGTTACC 


aGATGGACaT 


CCGaGAtCAC 


780 


25 


TACyTTTAAG 


TTTGACGAAA 


AAAATGGGTT 


CAAnAAACAC 


GTAGTATTTA 


TGnAAAAGTA 


840 




TTGAAAGCGC 


TTTACCAACC 


TGTTAATATA 


TAATAGTAAT 


ATAC 




884 



(2) INFORMATION FOR SEQ ID NO: 186: 

30 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6876 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

35 

- (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 186: 

40 AATTTCATCT GCTCGTGCAA AATCTTTGTT TTTCCTTGCT TCATTACGCT CTTCGATTAA 60 

TTTTTCAACA TCTTCATCCA ATAATTCATC TGCATTTTTA GATTTTAACG GTACACCTAA 120 
AACATCGCTG AAAATTTGAT AAACTGCTTT AAATTTATCA ATTACTTCTG TTGATGTTGT 180 

45 GTTCTCTAGT ACATATTTAT TCGCAAGTkT TGCTAAATCA TACCAAGCTG TAATTGCATT 240 

AGCTGTATTA AAATCATCAT TCATAACTGT TTCAAAACGA TTTAAAATCG CATCAATTTG 300 
ATCAATATAT GTCTGTTGAT TTTCAATATT AGTAGCAATT TGTGCGCGCT CTTCAATTAA 360 

SO 

TTGATAACTA TTGCGAATAC GCTCTAGTcC aCTACGTGCT GATTCTACCA ATTCTAGATT 420 
ATAGTTAATT GGGCTTCTAT AATGTACGCT AATCATAAAG AATCTTAGTA CATCTGGATC 480 

55 
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ATTATCAATA TTAATGAAAC CATTATGCAT CCAATAATTA GCAAATGGCG CATGATTATG 600 

TGCTTCTGAT TGTGCTATTT CATTTTCATG ATGTGGAAAT TGTAAATCTG AACCACCCGC 660 

ATGTATATCA ATTGTAGGTC CTAGCTCATG AAATGCCATT ACAGAACATT CTATATGCCA 720 

TCCTGGTCTA CCTTCACCAA ATGGGCTATC CCAACTAATC TCGCCAGGTt CGCTTTTTTC 780 

CACAATGTAA AATCAAGTGC ATCTTCTTTA TGCTCTCCTG CATCTATACG AGCACCCACT 84 0 

TTT AAGT CAT CTATGGATTG ATGACTTAAT TTACCATAAC CTTCAAATTT ACGTGTTCTA 900 

AAGTAAACAT CGCCACCACT TTCATATGCA TAACCTTGAT CCACCAAATC TTTAATAAAT 960 

TGAATAATGT CATCCATATG GTCCATTACC CTTGGATTTG AAGTCGCTTT TCTAACATTT 1020 

AACGCACCAA CATCTTCATG AAAAGCAGCG ATATATTTTT CTGCAATTTC GGGAACAGAC 1080 

TGATTTAATT CTTGAGAACG TTTAATTAAT TTATCATCTA CGTCTGTAAA ATTTGATACA 114 0 

20 TATTCTACAT TATATCCTTG GTATTCAAAG TAACGTCTCA CTACGTCATA ATTAATTGCw 1200 

GGTCTTG CGT TACCAATATG AATGTAGTTA TATACAGTAG GACCACATAC ATACATTTTT 1260 

A C TTTCCCTG GTTCTATAGG CTTGAACACT TCTTTTTGAC GTGTAAGCGT ATTATATAAT 13 20 

GTAATCATCT TGAATCTCTC CATTCCTAGT CTTTTCAAGT TGTCGTTCTA AATGCTTAAT 13 80 

TTGTTCATAA ATTGGATCAG GTAGATGGCG ATGATCAAAT GTTTTTCCAA CTCGAACACC 144 0 

ATCTTGCTTA ACAATATGTC CTGGTATACC AACAACCGTT GAATAACTTG GAACTGATTG 1500 

TAAAACAACT GAATTTGCAC CAATATTTAC ATTTGAATTT ATTTTAATAT TTCCTAAAAC 1560 

TTTCGCACCG GCTGCTATTA AAACATTGTC TCCTATATCT GGGTGTCTTT TCCCTCTTTC 1620 

TTTCCCTGTC CCACCAAGTG TCACGCCTTG ATAGATTGTC ACATTATCAC CAATTGTACA 1680 

TGTTTCTCCT ATTACAACGC CCATACCATG ATCTATAAAT AGACGCTTTC CAATTTTAGC 1740 

ACCTGGATGG ATTTCTATAC CTGTGAAAAA TCTTGAAATT TGAGATATCG CGCGTGCTGC 1800 

AACATATTTT TTTTGGTTGT ATAACTTATG TGCAATCAAA TGACTCCAAA CTGCATGTAA 1860 

ACCTGCATAC GTTGTAATGA CTTCTAATGT TGAACGTGCC GCTGGATCCT GCTCAAATAC 1920 

CATTTTTATA TCGTCTCTCA TTCTTTTTAA CAAGATCATT TCCTCCTCAA TGATTGAACT 1980 

ACGTAAATAC ATAATTGAAG TACCTGCGAA ATTAAATATC AAAAAAGCAC CACTAACATA 2040 

CAAATTGTAT TGTTAGAGGC GCTTCCGCAC GGTTCCACTC TGAATTTAGC GAATAACATT 2100 

AATAATATTG CGGGCGCTTC CAAATTATCA AGGAAACTAA GTCAACTTAA TGCTCATCAC 2160 

TCTCATTATA TATTTAATTC ATTTTACGAA GGTGCATTCA TTAATTTCTA CGTTGTACTC 2220 

ACAGCAACCG TACACTCTCT GCATCGTATA AATTTAATTA CTAATCCTTC GTTTTATATA 2280 

SS 
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ATAAAATTCA AGTATATACT ACCTTGATCT TGTCTATTTC ATTACTTATA TTGTTTTAAA 24 00 

CGGTTTAGCA CTTTTTCTTT ACCAAGTACT TCAATTGTAT TTGGTAATTC AGGACCATGC 2460 

ATTTGGCCTG TTACAGCAAC ACGAATAGGC ATAAATAATT GCTTGCCTTT TATTC CTGTT 2520 

TCTTTTTGAA CTTCTTTAAT TGTCTTTTTA ATTTCAGCCG CTTCAAATGG TTCAAGTGCT 2580 

TCTAATTTAC TGAATAAGTG CGTCATTAAC TCTGGTACTT GCTCTCCATT AATCACTTGT 2640 

TGTTCTTCTT CACCAAGAGC TGGCATTTCT TTAAAGAACA TTTCTGATAA AGGTACAATT 2700 

TCACCGGCAT AACTCATTTC TTTTTGATAA AGCGCAATTA ATTTGCGTC C CCAAGATAAA 2760 

1S TCCTCTTCTG ACGGCACCTC AGGAATCAAA TTTGCTTTAA TTAAATGAGG TAATGCTAAT 2820 

TGGAATACTG TTTCAGTATC TTTTTGTTTC ATATATTGGT TATTAACCCA TGCTAATTTT 28 80 

TGCTTATCGA AAAATGCTGG TGATTTTGAC AAACGCTTTT CATCAAAGAT TTTGATAAAT 2940 

20 T CTT CTTT AG AAAAGATTTC TTCTTCACCT TCAGGAGACC AACCTAATAA CGCAATAAAA 3000 

TTAAATAACG CTTCAGGTAA ATAACCTAAG TCACGATATT GCTCAATAAA TTGTAAAATT 3060 

TGCCCATCAC GTTTACTTAA CTTTTTACGT TCTTCATTAA CAATTAATGA CATATGACCA 3120 

AAACGAGGTG GCTCCCAGCC AAATGCTTCA TAAATCATAA TTTGTTTAGG CGTGTTTGAA 3180 

ATATGAT CAT CACCACGAAT TACATCTGAA ATTTGCATGT AATGATCATC TATAGCTACT 3240 

GCAAAATTGT ACGTTGGAAT GCCATCTTTT TTTACGATAA CCCAGTCACC AATACCATTT 3 3 00 

GAATCAAATG AAATATTTCC TTTTACCATA TCATCAAATG AATACGTTTG GTTTTGAGGT 33 60 

ACTCGGAAAC GAATTGATGG TTGGCGTCCT TCTGCTTCAA ATTGTTGACG TTGTTCTTCA 34 20 

3$ GTCAAATGCG CATGTTGACC ACCATAGCGA GGCATTTCAC CACGAGCGAT TTGCGCTTCA 34 80 

CGTTCAGCTT CTAATTCTTC TTCTGTCATA TAGCATTTAT ATGCTTTATC TTCTGCTAGT 3540 

AACTGATCTA TTAATGGTTG GTAGATATGT TGACGTTCAG ATTGACGATA TGGTC CGTAG 3600 

40 CCATTGTCTT TATCTACAGA CTCATCCCAA TCTAATCCTA ACCATTTAAG ATTATCAAAT 3660 

TGTGATGTTT CTCCATCTTC TAAATTACGT TTTTTATCAG TATCTTCAAT TCGAATCACA 3720 

AAATCTCCGT TGTAATGTTT AGCATACAAG TAATTGAATA ATGCTGTTCT TGCATTACCA 3780 

ATATGAAGAT ACCCAGTTGG ACTTGGTGCA TAT CTT ACTC TTATACGATC GCTCATTTTT 3 34 0 

TTCACTCCTA AATTAAATAT CAGATTTTCA AGTTAGTTCA TATAAATTGT TCATTTGCTA 3 900 

TCTTCGACCG TCATAACAAA TGTCTAACTC GTCTTATTGT TAAAACGAAA CAATGCTTTT 3 960 

TAACATGACC TTAAAATAAT TTCATTGTTT AATCATAACA TAATTCCCTG GGTAATATGC 4020 

TTAAATTTTA AATAGAAAGC TGTTGTTTTT TCAACACTTT AAAAAAGCTA TCCCTAAGAA 4 08 0 

55 
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TTAAACTTCA 


AATTAACTAT 


TCAAATACGT 


TAAAATTGAT 


TCTAATTTTG 


TATGTCTTGA 


4200 




TTGCTATAAG 


AATAACTTTA 


TTAATATCTA 


AAATTTAACA 


CTTAATGAAC 


TTGTTTCAAT 


4260 


5 


GATATATTAG 


CACTATTTGT 


ATTTTTTGAT 


AACTAATATG 


TTTTGCATTT 


ATTTATAGTT 


4320 




ATACTTCAAA 


TTACAAACTt 


CGCCATTTCA 


TATACCTTTT 


AATATCTATT 


TTGTTTTCGT 


4380 


10 


CAACTACAGT 


TTTTATAATG 


ATACTGTATC 


TTCGATTTTT 


TTAGCAAAAA 


CAATTCTTCC 


4440 


TGAAGATGTT 


TGCAATAAGC 


TGACTACTTC 


TAAATTGACA 


TGACTGCCAA 


TAAGATTTTT 


4500 




AGCATTATCA 


ACAACTACCA 


TCGTACCATC 


ATCTAGATAT 


CCTACTGCCT 


GACCAGGCtC 


4560 


15 


CTTACCCATT 


TTTGTCAGTA 


AAATATGCAG 


TTGATCACCT 


TGATGTACAT 


TAGGTTTGAT 


4620 




TGCTTCTGAT 


AAATCATTAA 


CATTTAATGC 


TTTGATACCA 


TGTACATGAC 


AAACTTTATT 


4680 




TAGGTTGAAA 


TCTGTCGTTA 


TAATACTTGC 


ATGATATTGT 


TTTGCTAATT 


TTAATAACAT 


4740 


20 


CGTATCAATA 


TCACTATGTG 


TTTTAGTTGG 


ATGT ATAACC 


TTTGTAGQAT 


AGTCTAAATC 


4 800 




ATACAATTCA 


TTTAAAATAT 


CTAAGCCTCT 


TTTACCCTTT 


TCaCGTTTAA 


CACTGTCATT 


4860 




TGAATCTGCA 


ACAATTTGTA 


ATTCATTAAT 


AACACCTTGT 


GGAATTAAAA 


TATTGCCATC 


4920 


25 


GATAAAACCG 


CAACGAATGA 


CTTCTAAAAT 


ACGACCATCA 


ATAATTGCGC 


TTGTGTCGAT 


4980 




AATTTTTGGC GTAgcaCTTT TaGTATGTTG TGACATGGAA 


CGCGCTATAT 


TCTCAGGTAA 


5040 


30 


AAACATTAAC 


ATTTCATCTC 


GTTTTTTAAG 


GCCAAATTGG 


AAACCGAAAT 


AACATAGTAA 


5100 


TATCGTAATT 


ATGACAGGAA 


TGAAATGATT 


AAAAATAGAG 


TTGCCAATTG 


ATTCTAATAT ' 


5160 




AAACGACACC ATAAGAGAAA TAAGTAATCC GATTATTAAA CCTATTGTTG 


CGAATAGTAT 


5220 


35 


TTCAACAGCA 


CTTCTACGCA 


TAATAAAATG 


TTCTAAACCT 


TTTATAGCGT 


TAGTAACTCG 


5280 




TCTAATAAAT 


ACACCAAAAA 


TTAAGAACAT 


AAAAATACTA 


CCGATAATGC 


CATCTACATA 


5340 




GTGATTTTTT 


AAAAAGCTGG 


AGTTTTGTAA 


TCCAAGATCA 


TTTGCAATTT 


CAGGAATAAT 


5400 


40 


AATTATTCCT 


AATGCGCTCC 


CAATAATTAA 


GT AAATAAT A ATAACCATTA 


GTTTAACGAT 


5460 




ATTCACACAA 


TGTCCTCCTT 


TCTTGATGTT 


TTATGAATGA 


AGAGCAAATG 


ACAATACTTC 


5520 




ATGTACAGTA 


GTTACACCTA 


TTACTTGTAT 


ACCTTCAGGA 


TATGTCCATC 


CGCCTATATT 


5580 


45 


ATTTTTAGGA ATAATTACAC 


GTTTGAAACC 


TAGTTTTGCA 


GCCTCTTGCA 


CGCGTTGTTC 


5640 




TATCCGAGAT 


ACACGACGTA 


CCTCACCCGT 


TAAACCAACT 


TCTCCAATAT 


AGCAATCTAA 


5700 


SO 


TCCGTCGACA GCTTTATCTT TAAAGCTAGA TGCAGTTGCT ACAATTACAC 


TTAAATCAAC 


5760 


TGCTGGCTCC 


GTTAACTTTA 


CACCGCCAGC 


TACTTTGATA 


TAAGCATCTT 


GTTGTTGTAA 


5820 




TAGATAATTT 


TCTTTCTTTT 


CCAAAACAGC 


CATCAACAAA 


CTTAATCGAT 


TATGATCAAT 


5880 



55 



875 



EP0 786 519 A2 



5 



10 



25 



TATTAAAAGT 


VTVJ X l» X Vjij l lv. 


CCTCCATGGT 


TGCAACAATT 


GTTGAACCTG 


GAACATTTGT 


6000 




TfTA A A A Af^A 


TTTCAGATGG 


ATTATTTACA 


CC ii'iTAATC 


CACTTTGCTT 


6060 


A'T'TTCY^ A Af3 




CATTCGTTGA 


ACCAAAACGG 


TmTAACAG 


CTCGCAAAAT 


6120 


x vjx-v ini .\j 


1 o\j X 1 


UjCCTTCAAA 


ATAAAGCACA 


GTATCaACCA 


TGTGTTCTAG 


6180 


r* A A T (""VTClflCl 




TGACCTT CTT 


TCGTTACATG 


ACCCACTATA 


AAAGTTGCaA 


6240 


IvjI Xl_A.X I ilj 


I 11 AG LAATA 


TTCATTAAAC 


TTTGTGTACT 


TTCACGAACT 


TGTGAAACAG 


6300 




ACjACj C_TG A 1 I 


TCAGGATGAT 


ATATTGTTTG 


AATCGAATCC 


ACTACTAATA 


6360 


nn 1 1 x\j 


TTCTTCTTTT 


ACTGTTTGAT 


AAATAACTTC 


AAGATCTGTT 


TCAGCTAATA 


6420 


V. x l uLAA i 1L 


ACTTGAATCT 


TCATCTAATC 


GCTCTGCACG 


TAATTTAGTC 


TGACTAAGCG 


6480 


ATT CTTCTCC 


AGTAATATAT 


AGTACTTTTT 


TCTTTTGAGA 


TAACGATGCA 


CAAATTTGTA 


6540 


AAAGTAACGT 


TGACTTAC CA 


ATACCTGGAT 


CCCCACCAAT 


AAGTACTAAC 


GATCCGCTCA 


£ c r\r\ 

w w w v# 


LAAlALvTCC 


ACCTAATACA 


CGGTTGAATT 


CTGCTGAATC 


TGTTAACACT 


CTCGGCGTTG 


6660 


TTTCATGTTT 


AATACTATTT 


AATTTTTGTA 


CTTTACCTGC 


TAATTCCTTG 


GTTTTAACTC 


6720 


CATGTTTAGG 


ATTGGCTGCT 


TTTTCAACAA 


TTTCCTCCAT 


TTGATTCCAA 


GCGCCACAAT 


6780 


TAGGACATTT 


CCCCATCCAT 


TTAGGAGATT 


GATAACCACA 


AGCCATACAT 


TCAAAAATCA 


6840 




GGCCArAATT 


GCAcCTCCAC 


TTTCTT 






6876 



30 

(2) INFORMATION FOR SEQ ID NO: 187: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1193 base pairs 
3S (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 187: 



45 



SO 



CAACTCAAAC 


AGCAGAACAA 


CGTCGTGAGT 


TGATTAATGG 


TGTATTTACT 


GACATTAATC 


60 


C CAT ACATT A 


AAAATATGAT 


GTACGTGTTA 


GCAGATAATA 


GACATAT CTC 


ATTAATAGCT 


120 


GACGTATTCA 


AGGCGTTCCA 


AAGCTTATAT 


AACGGACACT 


ACAATCAAGA 


TTTTGCAACA 


180 


ATTGAGTCAA 


CATATGAATT 


GAGTCAAGAA 


GAGTTAGATA 


AGATTGTCAA 


ACTAGTAACT 


240 


CAACAAACGA 


AGTTATCTAA 


AGTTATTGTA 


GATACAAAAA 


TTAATCCAGA 


TTTAATTGGT 


300 


GGATTTAGAG 


TTAAAGTCGG 


CACAACTGTA 


TTAGATGGTA 


GTGTTAGAAA 


TGATCTTGTC 


360 


CAATTACAAA 


GAAAATTTAG 


AAGAGTTAAT 


TAATTATAAA 


GAGGAGTGAC 


ATAGATGGCC 


420 
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ATGTCCGTAA 


CTGATGTAGG 


TACTGTATTA 


CAAATTGGTG 


ATGGTATTGC 


ATTAATTCAC 


540 


GGATTAAATG 


ACGTTATGGC 


TGGTGAGCTA 


GTAGAATTCC 


ATAACGGCGT 


ACTTGGTTTA 


600 


GCCCAAAACC 


TTGAAGAGTC 


AAACGTGGGT 


GTGGTTATTT 


TAGGACCATA 


CACAGGTATT 


660 


ACTGAAGGTG 


ACGAAGTTAA 


ACGTACTGGT 


CGTATCATGG 


AAGTACCAGT 


AGGTGAAGAA 


720 


CTAATCGGAA 


GAGTTGTTAA 


TCCATTAGGA 


CAACCTATTG 


ATGGAcAAGG 


ACCGATTAAC 


780 


ACAACTAAAA 


CACGTCCaGT 


AGAGAAAAAA 


GCTACTGGTG 


TAATGGATCg 


TAAATCAGTA 


840 


GATGAGCCAT 


TACAAACAGG 


TATCaAAGCA 


ATTGATGCTT 


TAGTACCAAT 


TGGTAGAGGT 


900 


CAACGTGAGT 


TAATCATCGG 


TGACCGTCAA 


ACAGGTAAAA 


CAACAATTGC 


AATTGACACA 


960 


ATTTTGAACC 


AAAAAGATCA 


AGGTACGATT 


TGTATCTATG 


TTGCTATTGG 


TCAAAAAGAT 


1020 


TCAACAGTAA 


GAGCAAATGT 


TGAAAAGTTA 


AGACAAGGAG 


GCG CTTTAGA 


CTACACTATT 


1080 


GTTGTAGCAG 


CATCAGCTTC 


TGAACCTTCT 


CCATTATTAT 


ATATTGCACC 


ATATTCAGGT 


1140 


GTAACAATGG 


GTGAAGAATT 


CATGTTTAAC 


GGTAAACATG 


TTTTAATCGT 


TTA 


1193 



(2) INFORMATION FOR SEQ ID NO: 188: 

25 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5549 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

30 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 188: 



3$ 



40 



45 



50 



TGCTAAGAAG 


TCAAAATAAA 


CTAACTATnA 


AACATCTAGT 


ACGATTATTA AAGTGACAGA 


60 


TnATAAAATT 


GAATTATTnA 


GAGAAGGAGA 


TATAAAGTTT 


GAAGAAATAA 


AAGAAAGACT 


120 


AGGTACAGGT ATTATTTATG AATAAGTTAA TACTTGGGAT TTATTTATAC CGAA1TTTIT 


180 


CACGAGCATA 


CTTTTATTTA 


CCGTTTTTAT 


TAATTTACTT 


TTTGATTCAA 


GGTTATTCCA 


240 


TAATACAATT 


AGAAATATTA 


ATGGCGTCTT 


ATGGCATTGC 


AGCATTTTTA 


TTCTCTCTAT 


300 


ACAAAGAGAA 


GTGTTTTAAA 


ATTTGTAACT 


TAAAAGATTC 


TAATAAATTA 


GTTGTTAGTG 


360 


AAATATTCAA 


AATCATCGGT 


TTATTGTTGT 


TATTATATCA 


AAATCAATAT 


TTAATTTTAG 


420 


TAGTGGCACA 


AATATTATTA 


GGGTTAAGTT 


ACTCAATGAT 


GGCGGGTGTT 


GATACCGCAA 


480 


TAATTAAAAG 


AAATATAACA 


AATGAGAAAT 


ACGTACAAAA 


TAAGTCAAAT 


AGCTATATOT 


540 


TCCTATCATT 


ATTAATTTCA 


GGGATTATAG 


GTAGTTATCT 


TTATGGAATA 


AATATTAAAT 


600 


GGCCTATAAT 


AATGACTGGT 


ATATTTTCAA 


TTCTAACAAT 


TATAATTATT 


CGATGCACAT 


660 
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TACCAGAAGA GAAGTTTTGG ATATTGCATT ATTCTTTTTT AAGAGCGTTA ATATTAGGAT 780 

TTTTTATAGG ATTTATTCCA ATTAATATAT ATAATGATTT AAAACTGAAT AATTTACAAT 840 

5 

TTATTTCAGT ATTAACTTGT TACACAGTTA TGGGTTTTGT ATCTTCACGT TATTTAACTA 900 

AATACTTGAA TTATAAGTTT GTGTCAGAAA TTTGTTTAGT AATATTTTTA ATAATATATA 960 

CATATCAAAG TTTCATAGCA GTTACTATTT CTATGATATT TTTAGGTATT TCTTCAGGGT 102 0 

10 

TAACTCGTCC ACAAACTATA AATAAACTTT CTAGCAGTAG TAACTTAAGA GTGATGCTTA 1080 

ATTATGCAGA AACGTTATAT TTTATTTTTA ATATCGCATT TTTACTTATG GGTGGTTACT 114 0 

is TATATACAAT AGGAACTATT CAATACTTAA TATTATTTAT TTCGTTATTA ATTTTTATAT 1200 

ATTTAATAAT AATATTTyAT TTTACAAGGA GAGAGCAACA TGAAAATAAA AACTGAATTT 1260 

AAAGGGAACA ATATACCATA TGAATACGCA GCAGGTGCAG ATGTGAGTGA TTCTATTAAC 1320 

20 GGGAATCCAA TTAAGTCATT TCCATTTGAA GTAATTGAAT TACCGGAAGG gACTAAATAT 13 80 

CTTGCTTGGT CTTTAATTGA CTATGATGCA ATTCCTGTAT GTGGCTTTGC TTGGATTCAT 1440 

TGGAGTGTAG CTAATGTAAG TGTTAGTGGC AATTCAATTT CTATAAAAGC AGATTTATCA 1500 

25 

AGAACAAAGG G CGACTATGT ACAAGGTAAA AATAGCTTTA CTAGTGGGTT GTTGGCTGAA 1560 

GATTTTTCAG AAATAGAAAA TCACTATGTA GGACCTACAC CACCTGATCA AGATCATCAA 1620 

TATGAATTAA CAGTTTATGC GTTAGATCAT TCTTTAAATT TGAAGAATGG GTTCTACTTG 1680 

30 

AATGAATTTT TAAAAGAAGT AAATCAACAT AAAATTGATC AAACAAGTAT TAACCTTATA 174 0 

GGAAGAAAAA TTTAATACTA AATATCTCAT CAATATAAAA TTGTTCAATT AAAAGTACAA 1800 

35 AGAAACAAAG GTTTTAATTT ATATATTAGG TACGGCGTTC GCTATAATGC AAAGAAGTAA 1860 

TTAAATTTAA GAAATGTAAA CTTAGTTATT GTAATGTGAA TTTATTTGAA AAAATAGAAA 1920 

GTATTAACAA TTATAGCTTT TACATTAATT AAAATTTATT TTTAAAAACA AGTAAACAAT 1980 

40 TTACATACTT ATAATTTTTG AAAATTTTCA ATTTGTGTTA TATTGATTTT GTAAGATACT 2040 

TTAACTCACA AAGGAGAGAG AGTATATGAA ATTAAAATCA TTTATAACTG TAACTTTGGC 2100 

ACTGGGCATG ATCGCAACGA CTGGCGCTAC TGTGGCAGGT AATGAGGTAT CTGCAGCAGA 2160 

45 

AAAGGACAAA CTACCGGCAA CTCAAAAAGC TAAAGAAATG CAAAATGTTC CATATACAAT 2220 

TGCAGTAGAT GGCATTATGG CTTTCAATCA ATCTTACTTA AATTTACCAA AAGATAGCCA 2280 

ATTATCATAT TTAGATTTAG GAAATAAAGT TAAAGCTTTG TTATATGATG AACGCGGTGT 2340 

SO 

AACACCTGAG AAGATTCGAA ATGCAAAATC TGCCGTTTAC ACGATTACTT GGAAAGATGG 2400 

TAGTAAAAAA GAAGTGGATC TTAAGAAAGA TAGCTACACA GCAAACTTGT TTGATTCAAA 2460 

55 
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CAACATGAAG CATTTAATTT TACAGTGATG ATTATAAAAT AATTGCCTTG ATACAAAGAT 2 580 

TACTCGTAAA TGACATCTTT GTATTAAGGC TTTTTCTAAA TTTAAAAGTG ATGGGTTAGA 264 0 

GGTCATTGAG CTTTAAAATA TTCAAAATAC AAAACATTAA TGGCCAAAAA TAAAAGCCGC 2700 

CTTTATCTGG GCAGCTTCAA TAATAAGAAA GACATATTTC ATTTTATACT AAATAGTTAT 2760 

TGTGATGAAT CTTTCGGCGG TTTAATTACT GCAGCAAAAA TTGCTGTGAA AATCGTGAAC 2 820 

AATACTGCCA TGATAATTGG ATTCACTACA TTTAAG CTGT CTCCACCTAC TAGGCTATTA 2 880 

AGTACAAAGT TAACCATTTG CATTAATAAT AATGCCCAAA AGAATGTTAC GAGGTGTTTC 2 940 

ATGTCATTCT ACCTCCACTT TAATTATATA TATTTTATTT TAAGTGAAAG TTAGAAATTT 3000 

GTATAGTAAC ATCTCATATA TTTTGACCAT ATTATACAGT TTAAATAAAT GATTTTATCT 3060 

GAATGGCTAT TCTAAATTAA GCGCATTAAA ACCAATTTCA TACTGAAATT TGACGATAAT 3120 

20 AAAGCATTAA AATTTTATTA ACTAGTCAAT ATTCCTACCT CTGACTTGAG TTTAAAAAGT 3180 

AATCTATGTT AAATTAATAC CTGGTATTAA AAATTTTATT AAGAAGGTGT TCAACTATGA 3240 

ACGTGGGTAT TAAAGGTTTT GGTGCATATG CGCCAGAAAA GATTATTGAC AATGCCTATT 3300 

TTGAGCAATT TTTAGATACA TCTGATGAAT GGATTTCTAA GATGACTGGA ATTAAAGAAA 3360 

GACATTGGGC AGATGATGAT CAAGATACTT CAGATTTAGC ATATGAAGCA AGTTTAAAAG 3420 

CAATCGCTGA CGCTGGTATT CAGCCCGAAG ATATAGATAT GATAATTGTT GCCACAGCAa 34 80 

CTGGaGATAT GCCATTTCCA ACTGTCGCAA ATATGTTGCA AGAACGTTTA GGGACGGGCA 354 0 

AAGTTGCCTC TATGGATCAA CTTGCAGCAT GTTCTGGATT TATGTATTCA ATGATTACAG 3600 

CTAAACAATA TGTTCAATCT GGAGATTATC ATAACATTTT AGTTGTCGGT GCAGATAAAT 3660 

TATCTAAAAT AACAGATTTA ACTGACCGTT CTACTGCAGT TCTATTTGGA GATGGTGCAG 3720 

GTGCGGTTAT CATCGGTGAA GTTTCAGATG GCAGAGGTAT TATAAGTTAT GAAATGGGTT 3780 

40 CTGATGGCAC AGGTGGTAAA CATTTATATT TAGATAAAGA TACTGGTAAA CTGAAAATGA 3840 

ATGGTCGAGA AGTATTTAAA TTTGCTGTTA GAATTATGGG TGATGCATCA ACACGTGTAG 3 900 

TTGAAAAAGC GAATTTAACA TCAGATGATA TAGATTTATT TATTCCTCAT CAAGCTAATA 3 960 

TTAGAATTAT GGAATCAGCT AGAGAACGCT TAGGTATTTC AAAAGACAAA ATGAGTGTTT 4 020 

CTGTAAATAA ATATGGAAAT ACTTCAGCTG CGTCAATACC TTTAAGTATC GATCAAGAAT 4 080 

TAAAAAATGG TAAAATCAAA GATGATGATA CAATTGTTCT TGTCGGATTC GGTGGCGGCC 4140 

TAACTTGGGG CGCAATGACA ATAAAATGGG GAAAATAGGA GGATAACGAA TGAGTCAAAA 4 200 

TAAAAGAGTA GTTATTACAG GTATGGGAGC CCTTTCTCCA ATCGGTAATG ATGTCAAAAC 4 260 

55 
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35 



TGAACCTTAT 


AGCGTTCACT 


TAGCAGGAGA 


ACTTAAAAAC 


TTTAATATTG 


AAGATCATAT 


4380 


CGACAAAAAA 


GAAGCGCGTC 


GTATGGATAG 


ATTTACTCAA 


TATGCAATTG 


TAGCAGCTAG 


4440 


AGAGGCTGTT 


AAAGATGCGC 


AATTAGATAT 


CAATGAAAAT 


ACTGCAGATC 


GAATCGGTGT 


4500 


ATGGATTGGT 


TCTGGTATCG 


GTGGTATGGA 


AACATTTGAA 


ATTGCACATA 


AACAATTAAT 


4560 


GGATAAAGGC 


CCAAGACGTG 


TGAGTCCATT 


TTTCGTACCA 


ATGTTAATTC 


CTGATATGGC 


4620 


AACTGGGCAA 


GTATCAATTG 


ACTTAGGTGC 


AAAAGGACCA 


AATGGTGCAA 


CAGTTACAGC 


4680 


ATGTGCAACA 


GGTACAAATT 


CAATCGGAGA 


AGCATTTAAA 


ATTGTGCAAC 


GCGGTGATGC 


4740 


AGATGCAATG 


ATTACTGGTG 


GTACAGAAGC 


ACCAATTACT 


CATATGGCAA 


TTGCTGGTTT 


4800 


CAGTGCAAGT 


CGAGCGCTTT 


CTACAAATGA 


TGACATTGAA 


ACAGCATGTC 


GTCCATTCCA 


4860 


AGAAGGTAGA 


GATGGTTTTG 


TTATGGGTGA 


AGGTGCTGGT 


ATTTTAGTAA 


TTGAATCTTT 


4920 


AGAATCAGCA 


CAAGCTCGAG 


GTGCCAATAT 


TTATGCTGAG 


ATAGTTGGCT 


ATGGTACTAC 


4980 


AGGTGATGCT 


TATCATATTA 


CAGCGCCAGC 


TCCAGAAGGT 


GAAGGTGGTT 


CTAGAGCAAT 


5040 


GCAAGCAGCT 


ATGGATGATG 


CTGGTATTGA 


ACCTAAAGAT 


GTACAATACT 


TAAATGCCCA 


5100 


TGGTACAAGT 


ACTCCTGTTG 


GTGACTTAAA 


TGAAGTTAAA 


• 

GCTATTAAAA 


ATACATTTGG 


5160 


TGAAGCAGCT 


AAACACTTAA 


AAGTTAGCTC 


AACAAAATCA 


ATGACTGGTC 


ACTTACTTGG 


5220 


TGCAACAGGT 


GGAATTGAAG 


CAATCTTCTC 


AGCGCTTTCA 


ATTAAAGACT 


CTAAAGTCGC 


5280 


ACCGACAATT 


CATGCGGTAA 


CACCAGATCC 


AGAATGTGAT 


TTGGATATTG 


TTCCAAATGA 


5340 


AGCGCAAGAC 


CTTGATATTA 


CTTATGCAAT 


GAGTAATAGC 


TTAGGATTCG 


GTGGACATAA 


5400 


CGCAGTATTA 


GTATTCAAGA 


AATTTGAAGC 


ATAACTATAA 


nAATCTTCAG 


TAACGTTGTT 


5460 


TTAGTTACTG 


AAGATTTTTT 


CaGTTTCTTT 


ATACTAAGAT 


GAGCGACACA 


CAATCGTCAT 


5520 


AATAAAATAT 


GAATATTTAT 


TAATAATAA 








5549 



(2) INFORMATION FOR SEQ ID NO: 189: 

{17 SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4832 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



50 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 189; 
AGATTATAGT AAGATTGATA GTTTGGCGAC TGaAGCgCGa GaAAAATTAT CAGaAGTAAA 60 
mCCTTTAAAT ATTGCACAAG CTTCTAGAAT ATCAGGGGTA AATCCAGCAG ACATATCTAT 120 
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TGGTTAGCAG AACAATTAAA AGAACATAAT ATTCAATTAA CTGAGACTCA AAAACAACAG 
TTTCAAACAT ATTATCGTTT ACTTGTTGAA TGGAATGAAA AGATGAATTT GACAAGTATT 
ACAGATGAAC ACGATGTATA TTTGAAACAT TTTTATGATT CCATTGCACC TAGTTTTTAT 
TTTGATTTTA ATCAGCCTAT AAGTATATGT GATGTAGGCG CTGGAGCTGG TTTTCCAAGT 
ATTCCGTTAA AAATAATGTT TCCGCAGTTA AAAGTGACGA TTGTTGATTC ATTAAATAAG 
CGTATTCAAT TTTTAAACCA TTTAGCGTCA GAATTACAAT TACAGGATGT CAGCTTTATA 
CACGATAGAG CAGAAACATT TGGTAAGGGT GTCTACAGGG AGTCTTATGA TGTTGTTACT 
GCAAGAGCAg TAGCTAGATT ATCCGTGTTA AGTGAATTGT GTTTACCGCT AGTTAAAAAA 
GGTGGACAGT TTGTTGCATT AAAATCTTCA AAAGGTGAAG AAGAATTAGA AGAAGCAAAA 
TTTGCAATTA GTGTGTTAGG TGGTAATGTT ACAGAAACAC ATACCTTTGA ATTGCCAGAA 
GATGCTGGAG AGCGCCAGAT GTTCATTATT GATAAAAAAA GACAGACGCC GAAAAAGTAT 
CCAAGAAAAC CAGGGACGCC TAATAAGACT CCTTTACTTG AAAAATAATG CATAATCCTT 
TACAACTAAC ATAAAAGGAG CGAATGGATA ATGAAAAAAC CTTTTTCAAA ATTATTTGGT 
TTGAAAAACA AAGATGACAT CATTGGACAT ATTGAAGAAG ATCG CAATAG TAATGTTGAA 
TCCATTCAAA TTGAACGTAT CGTTCCCAAC CGTTATCAAC CAAGACAGGT GTTTGAACCA 
AATAAAATTA AAGAACTTGC TGAATCAATA CATGAACATG GTTTACTACA AC CTATTGTT 
GTAAGACCGA TTGAAGAAGA TATGTTTGAA ATTATTGCTG GAGAGCGCCG ATTTAGAGCA 
ATACAATCAC TAAATTTACC TCAAGCAGAC GTTATTATTC GTGATATGGA TGATGAAGAG 
ACGGCTGTTG TTGCATTAAT TGAGAATATT CAAAGAGAAA ATTTGTCTGT TGTTGAAGAA 
GCGGAAGCCT ATAAGAAATT ATTGGAAATT GGTGATACAA CGCAAAGTGA ATTGGCAAAA 
AGTT^AGGTA aaagtcaaag CTTTATTGCA AATAAGTTGC GTTTATTGAA GTTGGCGCCG 
AAAGTACTAC TTCGCTTAAG AGAAGGTAAA ATTACTGAAC GTCATGCGAG AgcGGtATTA 
TCATTGTCTG ATAGCGAACA AGAAGCGTTG ATTGAGCAAG TCATTGCACA AAAGCTAAAT 
GTGAAcAGAc TGAAGATAGA GTACGCCAAA AAACGGGGCC CGAAAAAGTC AAAGCACAAA 
ACCTTCGCTT TGCACAAGAT GTCACTCAAG CACGAGATGA GGTAGGCAAA AGTATCCAAG 
CGATTCAACA AACAGGATTA CATGTTGAGC ATAAAGACAA AGATCATGAA GATTATTATG 
AAATAAAAAT TCGAATATAT AAACGTTaGT AGTAGGATGT CGTATACATG ATGACTAACA 
CATAAAAGAC AAAGCTAAGA TCATAACAGC TTTGTCTTTT TTTTTTGTTT TACGTGAAAC 
ATAAAAATTT ATATTTATAT GTTGATCAGG CTGGTACATA AATCAATGTT CTATGCTCTA 
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TTCTAGTCAA CCTTGCTGGG GTGGGACGAC GAAATAAATT TTGCGAAAAT AT CATTTCTG ~ 204 0 

TCCCACTCCC TAATTTGAGC TGGATATACT TTCATTTGAA CCCTTTATTG CTAGTTTATG 2100 

AAAGTATCAT GAAAGCTTTA TGAACATCGC TTGAGTTGCC TTTACAGTAG AAAATTTAAG 2160 

TTTTACACTT TGTGTGAATG ATACGTTTTG TATTGAATTA ATTATAGAAA GGTACGTTGA 2220 

AGATGTTTTC AATTGGAAGT GCAATTCTTC ATTTTGTCAT TGGTGGTATC GCTGTTGCAT 2280 

TAGCTTCAAT TATTGCTGAT AAGGTAGGTG GTAAGTTAGG AGGTATTATA GCTACTATGC 234 0 

CGGCAGTCTT TCTTGCGGCT ATTATCGCAT TAGCTTTAGA TCATCGTGGT ACGCAATTAG 24 00 

TGGAGATGTC GATGAATCTT AGTACTGGAG CAATTGTCGG TATTCTGTCT TGTATATTAA 2460 

CTGTATTTTT GACAT CTCTC TACATTAAGC ATAAAGGTTA TCGGAAAGGC G CAAT ATTCA 2520 

CAGTTGTTTG TTGGTTTGTC ATTTCCCTCG CAATATTCAG TATTAGACAT TTATAGTTTG 2580 

20 GAAAATGCGT GATAATTAGT TGTATTCAGT TATTAAGTAA TAAATTATTG GAGGCAGAAC 264 0 

ATCATGAAAT TAACATTAAT GAAATTTTTT GTGGGGGGAT TTGCAGTATT ATTAAGTTAT 2700 

ATTGTATCTG TAACACTACC TTGGAAAGAA TTTGGCGGTA TATTTGCaAC GTTTCCGGGA 2760 

25 GTATTTTTAG TGTCTATGTT TATTACAGGT ATGCAATATG GTGATAAAGT CGCTGTGCAT 2820 

GTAAGTCGTG GCGCAGTGTT TGGTATGACA GGGGTATTAG TTTGTATTTT AGTTACATGG 2880 

ATGATGTTAC ATATGACGCA CATGTGGTTG ATTAGCATTG TTGTTGGTTT CCTAAGCTGG 2940 

TTCATCAGTG CAGTATGTAT TTTTGAAGCG GTAGAATTTA TAGCACAAAA AAGATTAGAA 3000 

AAG CAT AGTT GGAAAGCTGG AAAATCGAAT AGTAAATAGT GTGAACGTAA TCTCTTAACT 3060 

AGGACTAACT TTGCAAGCAT TGAATAGCAT GGAAAAGTTG CATCATTAAT AAGTGAAATT 3120 

GAAGTTGGCA TTGAGAAAAT TACAAGCGCG TAATCATACa GGTCTGTCTT AAGGGAGTCT 3180 

TCGAACCCCG ATGTTGTCGT ATGTCAAAAC ATTTAGTCAA TCATAAAGGT GACTTGATTT 3240 

AACTTTATCT GATAGTCTGA TTGTAATGAT TGTACTAATT GACTGGAGGC GTATGTAATT 3300 

GAATCTGAGT AAACAAATTA AAAAGTATAG GGAACGAGAT GGTTATTCAC AAGAATATCT 3360 

TGCTGAAAAG TTATATGTAT CTAGGCAGAG TATTTCTAAT TGGGAAAATG ACAAAAGCTT 3420 

45 ACCAGACATA CATAACTTAT TAATGAyGTG TGAATTGTTC AATGTAACTT TAGATGATTT 3480 

AGTAAAAGGG ACCATTCCAT TTGTACCTGA TATTAAAGCG CAACGAAGTC TTAACTTATG 354 0 

GACATATGTG ATGCTTATTT TCATGACATT AGCTGCAATT TTAATGGGAC CTTTAGTTGT 3600 

SO 

TTATTGGAAT TGGACTTGGG GTGTAACGGT GGCAATCATT TTGGGAATAG GTTTTTATGC 3660 

ATCTATGAAA ATAGAAGATT TAAAAAAAGT GCATAAAATG GACAACTACG ATCGAATTGT 3720 
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GACAAATGCG CTTTCTATTA TATCAGTAAT TGGTATACTC AGCCTCATAA TTTTCCTTAG 3 84 0 

TGTGTATTTG GCAAATAAGT TTTTATAAAT CATCGTGGTA TCGTCTCATA TTATTTATAT 3 900 

TATCCAAAAT AGCATAAAAA AATACCAACA AGATTTAGAA CCTTGTTGGT AATCAAAGCG 3 960 

a TTCATTT AT AATGAGTCGT TTTATGTTGT AAGATTAAAC AGTTTGTACG TTAACTGCTT 4 020 

GGTCTCCACG TTGACCTTCA GTGATTTCGA AAGTAACTTT TTGACCTTCT TCTAAAGTTT 4 080 

TGTAGCCATC GCTAGCGATA CCTGAGAAAT GTACGAATAC GTCTCCGCCA TTTTCTTGTT 414 0 

CGATGAAACC AAAACCTTTT TCTGCrTTAA AC CATTTw AC TGTACCGTTA TTCATATwGA 4 200 

AwACCTCCGT gTGCTTTTGC ACTTAATATT TGTAACAAAT TCATAACTAA AAAAGAGGAT 4260 

ATTCTAAACA AATACACTAC AATTTAATTC ACGAGCTTTT ATTACGTAAG ACCAACTATA 4 320 

CGCT CAT ATT GGCATAATGT ACAGTGTTTT TTGAAAATAA ATTAAAAAAG ATTTTTAAAA 4 380 

20 ACCTTAGAAA CGTTGATTTA AAGGGGTTTA TAAAAATwAw AAAATTGTAG TCTTTTATGG 444 0 

TGTTTGCTAG TTTTCAAAGT GACATATCGT TTAAACATGA TGATTTTATA AGCAATCCAT 4 500 

AAAAAACAAG CAGCGATAAA CGCTACTTGT TGATATTAAA ATCTGACTTG AAAGGTCATA 4 560 

25 GCAATGTTCT ATACCGATGG AATGTGCTTA CTTGCCTTTT TCTTCACGAC GTTTTAAATA 4620 

ATAAGAGCCA CCTAATAAAC CAGCTGGAAT GCCTATCATT GGTGTTGTGA ATGAGCTTAA 4 6 80 

TACAATAACA AGTATTGTTA AAGCAATGAC GTTATACCAA GTTACAGTCA AATTTTTCAA 4 74 0 

30 

ATCCTCATAT GATTGTTTTA CTAATTCTCT AAATTTCATG ATTCAATCTC TCCTTTTTTA 4 800 

TAAATCTTTA GATTGTCAAA TTAAGCTGGA CA 4 832 

(2) INFORMATION FOR SEQ ID NO: 190: 

35 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5727 base pairs • 
T (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
40 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 190: 

45 CAAAGCTGTT CAAAAGGCTT ATAATTTAAA TTTAGATAAC ATACGTACAA TGGAACCTAA 60 

GTTGAGATAT CAAGCGATCA ATAAAGGTAA TATTAATTTA ATAGATGCAT ATTCAACTGA 120 

CGCTGAATTA AAACAATATG ATATGGTTGT GTTAAAAGAT GATAAGCACG TATTTCCACC 180 

50 _ ^ _ 

ATATCAAGGA GCACCATTAT TTAAAGAAAG CTTTTTAAAG AAACATCCAG AAATTAAGAA 240 

ACCGTTAAAC AAACTAGAAA ACAAAAT AT C TGATGAAGAT ATGCAAATGA TGAACTATAA 300 
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GTTAATCAAA TAACGACCAA CGCCACATAA GATGCGTAAC ACCAAATTAT ATCTTATGTG 420 

GCGTTGTTAT ATTTAAATCT ATAATTATGT TCAATTTAAA CATGCAATAA TGATTAAAAA 4 80 

ATATGACATG TTAAACACAA TGTAAGCTAT TATGATGTGA AAATAGTAGC ATTGCATTTT 540 

AGAAACATAG AGCGATATAA TGAATATAAG TTTTTTGAAA TTTCAGTTAA TTCTAAGGAG 600 

GTTGTTTTTA TTATGAAAGA ACAACTTAAT CAACTATCAG CATATCAGCC TGGTTTATCT 660 

CCAAGGgCAT TGAAAGAAAA GTATGGCATT GAAGGAGATT TATATAAACT TGCATCAAAT 720 

GAAAATTTGT ATGGACCATC GCCTAAAGTT AAAGAAGCGA TATCAGCACA CTTAGATGAG 780 

TTATATTATT ATCCTGAAAC AGGATCACCG ACATTAAAAG CGGCGATTAG TAAACATTTA 84 0 

AATGTAGATC AATCACGCAT TTTATTTGGT GCGGGATTAG ATGAAGTTAT ATTAATGATT 900 

TCTAGAGCTG TATTAACGCC AGGGGATACT ATTGTTACAA GTGAAGCGAC ATTCGGTCAA 960 

T ATT AT CACA ATGCGATTGT TGAATCAGCT AATGTGATAC AAGT AC CTTT AAAAGATGGT 1020 

GGCTTCGATT TAGAAGGTAT TTTAAAAGAA GTTAATGAAG ATACGTCATT GGTATGGTTA 1080 

TGTAATCCAA ATAATCCTAC AGGTACATAT TTTAATCATG AGAGCTTAGA TTCGTTTTTA 1140- 

TCTCAAGTAC CTCCACATGT ACCAGTAATT ATAGATGAAG CTTATTTTGA ATTTGTGACA 1200 

GCAGAGGACT ACCCGGATAC ACTTGCTTTG CAACAAAAAT ATGACAATGC TTTCTTATTA 1260 

CGTACATTTT CAAAGGCGTA TGGATTAGCG GGTTTACGTG TAGGATATGT GGTAGCAAGT 1320 

GAACATGCGA TTGAAAAATG GAACATCATT AGACCACCAT TTAATGTGAC ACGTATATCT 1380 

GAATACGCAG CAGTTGCAGC ACTTGAAGAT CAACAATATT TAAAAGAGGT AACACATAAA 1440 

AATAGTGTTG AACGCGAAAG ATTTTATCAA TTACCTCAAA GTGAGTATTT CTTGCCAAGT 1500 

CAAACGAATT TTATATTTGT AAAAACmAAG CGGGTAAATG AACTTTATGA AGCACTTTTA 1560 

AATGTAGGGT GTATTACGCG ACCATTTCCA ACTGGTGTTA GAATTACAAT TGGTTTTAAA 1620 

GAACAAAATG ATAAAATGTT AGAAGTTTTA TCAAACTTTA AATACGAATA GTAAGTGGGG 1680 

AGTGGGACAG AAATGATATT TTCGCAAAAT TTATTTCGtC GTCCCACCCC AACTTGcATT 1740 

GTCTGTAGAA ATTGGGAATC CAATTTCtCT TTGTTGGGGC CCCGCCGGCA AGGTTGACTA 1800 

GAATTGAAAA AAGCTTGTTA CAAG CGCATT TTCGTTCAGT CAACTACTGC CAATATAACT 1860 

TTGTAGAGCA TTGAACATTG ATTTATGTCT CAAGCTCAAT GCAGTGTGAA TGATGAGGTG 1920 

AGAGTATTCA GTGTAAAAAG CAACAATAGA TGATATTGTT TTGTATCAAT TG C TTTTTTG 1980 

CTATACTGAA TCAATACTGA TATTTTCAGG AGAAGATTAA AATGACCCGT AAATCAATCG 2040 

CGATTGATAT GGATGAAGTA TTGGCAGATA CATTAGGAGA AATCATTGAT GCTGTCAATT 2100 
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TTCCTGAACA TGATGGATTA ATTACAGAAG TATTGAGAGA ACCAGGCTTC TTCAGACATC 2220 

TTAAAGTGAT GCCGTATGCA CAAGAAGTTG TGAAAAAATT AACTGAACAT TATGATGTAT 22 80 

ATATTGCTAC AGCAGCAATG GATGTACCAA CATCATTTAG TGATAAATAT GAATGGTTAC 234 0 

TAGAGTTCTT TCCATTTTTA GATCCTCAGC ATTTTGTTTT TTGTGGTAGA AAAAACATCG 24 00 

TTAAAGCTGA TTATTTAATA GATGACAATC CT AG AC AG CT TGAAATTTTT ACTGGTACAC 24 6 0 

CGATTATGTT TACAGCAGTG CATAATATTA ATGATGATCG ATTTGAACGC GTAAATAGCT 2 52 0 

GGAAAGATGT AGAACAGTAT TTTTTAGATA ATATTGAGAA ATAAAATATA TCACTTGAAA 2 580 

AATTTCATGT AGAAAAGATG ATGGATAGGC TATAAAGTAA TTGTGACTGA GATGAACTTT 264 0 

TATGTCTTAG ACACTACAAC ACTATATTGG CAGTAGTTGA CTGCGGGGCC CCAACATAGA 2700 

GAAATTGGAT TCCCAATTTC TACAGACAAT GCAAGTTGGG GTGGsCCCCA ACATAAAGAA 2760 

20 ATACTTTTTC TTTAGAAATT AGTATTTCTT ATGCATGAGT GTAACTCATG CATTCATATT 2820 

TTTAAGTACA CATTAGCTGT GACTAATGAT AAAGAATCGC TACATAATCA ATCATTAGTC 2880 

GTTCTTTATC ATTTCCGTCC CGCTCTCAAT AAATGTTAGT CTATCTTATT ATTATAAATC 294 0 

25 GGATGAATGT GTTAATCTAT GGCAGATTAC ACGTCATCCG ATTTTTTATA GAATTTGAAA 3000 

AAGACG CAT A AACCACTATG ATTTAAAATA CAACATCAAT CATTTTAGTG gCATGCGCCA 306 0 

AAATTATATG TCTGTTTTTG AAACAGGGTA ATAGCTTAAA GCTAATAAAA ACGAATATAA 3120 

GGTGCGTTGA ATCTTATGAT TACACTCCAA ACCTAATATA ATATCGGGTT AAGATCATTC ■ 318 0 

CGGATGCTTA CAAATCATTG ACAGTAAGTA ACTGAATGGC ATTTGGTATA ACCTCAATAT 3 24 0 

CAATAGGTGT TTCTAATGAA ATTTCGCCAT CAATATCAAC TTTCATTGCT GG AT CTGTTG 3300 

TAAGTGAAAT CTTTTTACCA GGTATATGCT CAATACCTTG AGTAATTTCA TTCCaATTCA 3360 

TGCTATCACG CTTTTTAAAA ATATCATTTA AAATACTGAA ACTTTGTTCA TTAAAAATGA 34 20 

AAGTGTTCAG TTCACCATCT TGAGGAGACA AATCAGTCaA TGGTATACGA CTACCACCAA 34 80 

TGAATGGACC ATTTGCTGTT AGTATCATGG TC G TTTCGCC AGAATATGTC TTATCATCTA 3S4 0 

TTGATAATTG ATAATTAAAT TGTGTTGGAT TTAGCAGTGT TTTGACAGTT GATCCAATAT 3600 

45 AACTCAATTT ACCAAATATA TCTTTTGAAC CATCTTGTAC GTTTTCAGCG TTTTGAACAA 3660 

TGAGACCTAA GCCAACAAAG TTGAGTGCAT ATTGATTATT TATTTTAATT ACATCGTATG 37 20 

TACCAACTTG TGCAGAAATC ATTTGTTCAC TAGCTTGTTT ATGATTAGGT GCTATATTTA 3780 

50 GCGTTTTTGT AAAATCATTA AAAGTACCGC CTGGTAAAAT GCCAATAGGG AGTTGAAGGT 384 0 

CATGTGTCAT AACACCGTTT ATAAGTTCGT TAACCGTGCC ATCACCGCCA AGAATAAATA 3900 
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CACCTTCGTT 
TAACTTCCCC 
CACCATGTGT 
TATATATACC 
AATAAATGAA 
TGAGCATATT 
AAAAACAGTA 
TATACCTTTC 
AATTGCAACA 
AACTAAAGTA 
TTGGGCATTA 
GCATAGCTCA 
TGATGAACCT 
CGTACCAATT 
AAGTGAAATA 
TTCACCAAAG 
ATATATGTTT 
AAATAATGGA 
AATAATTAAA 
AACTAAGTTA 
TAAJJACAACA 
AGTAGGTTTC 
ACCTAATGCC 
AAAGTGTTGC 
AACAAAACCT 
AATGTTTGGC 
GATTAATGCA 
TAAAGTAGCG 
CATATAGATT 



TTCACTCAAT 
AATACCTTGA 
ATATTTATTT 
CACTTTTAAT 
ATTGATTTCT 
AAGTTTTTAT 
AGCCATTTAA 
ATCGCTTTGA 
ACACCTAGGA 
CCATTGATTG 
AATGCTTTAG 
CCGATAACAC 
GATGCATAAC 
GCAAATTTTA 
ATTGGAGCTA 
TTTGTTTTCC 
AATACATTAG 
ATAAATGCTT 
GTGAAGTAAA 
AATGATAATG 
CTTCCGATAA 
ATACCAACGC 
ATACCAACTG 
AAAATAATAG 
GCATCCATAC 
TTCATTAAAC 
AATGGTAAGC 
CCTCTAGTGC 
AATGAACCAT 



TGAATAGAAA 
TTAATATTTT 
TCCATAGTTT 
TGTTAATACC 
ATAGAGTGGG 
TTATACTGAT 
ATGACTTACT 
TGATTAAAGG 
AAATAAAGTA 
CTTGTGCAGA 
GTGCTAACTT 
AAATAATGTA 
CTACAATACC 
CTGGCAGGCT 
GTAATAAAAT 
AACCAAATAA 
ACCCTTGTTC 
TAACACGAGA 
TGAnTGGTAA 
AGTTAGTTAA 
TAAGACCATA 
TACCTAAGTT 
CTGCAATCAA 
GTGATAATAA 
GTCTATCATT 
CTGAACCAAT 
TTAAACAAAT 
CTGTAATTCT 
ArACTGACAT 



GATGCTTACA 
TTAATCCACT 
AGCCTACTTT 
AAAAATATGT 
ACGAGAAAAT 
ATCTTGAATT 
GTTTTTTGAA 
TGAGAATGCT 
ATTTGTTTGA 
AGCGTTAGTT 
AACAGCAGCA 
CGATAAAATA 
AATTAGTATG 
AGGTTGTTTA 
AAATAATGGG 
GTTTAATTTC 
TTGAATAGCC 
ACGTTCAGTA 
TGCAATACCT 
TGCACCAATA 
CTTTTTCTTT 
TTTGCGGTTG 
GAATCCGCCG 
TGCACCCATA 
TTCAGGATAT 
AATGATGAAG 
ATGTCCGATA 
GTCAGCAATC 
AATTGACATA 



AATTGAACTT 
GTGTTCATGG 
CTAAAAATTG 
TTTTAAATAG 
ATAGTTATAG 
TAATTAATAG 
TTAGGCCAAC 
AATACAATTG 
CCTAGTGGTT 
AAGTACCAAA 
CTATTACCCG 
ACCCAGTTAA 
TATGACGCAC 
GTTCCAAGCT 
TTAATTGATT 
ATATCTGAAT 
CAGAACACCA 
TCAGTGACAT 
AATACTAAAA 
ACGATAATTA 
TCAGCTGGTG 
AAAAGTACAT 
TGGAAGTTTT 
TTAACTGACA 
AAACGGCCAA 
AACATTGATG 
ATAATAAAGA 
CATCCGCCTG 
GCTGTTGTTT 



AATGCTGTTG 
TAAAAGAGGA 
GTTCATTAAA 
AGAAAATGGT 
CTGTCTATAA 
AAACCTATAA 
AATATTAACG 
TTGTAACAAT 
CTATTAACTT 
TACTCATCAT 
TTGGTGATAA 
CTGAAAAGTT 
CTGCTAAGAA 
TTTGCCATAA 
GGAAGATCGC 
GTTCAATTCC 
TTCCAAGAAT 
CTTTACTTCT 
CAGTATTACT 
ATACAATTGC 
TCAATGGGTT 
ACCATACTAA 
TAACATTAAC 
TATAGAAAAT 
CGATATTTGA 
TGAATAAGCC 
CTGCACCTAA 
GTATTGATGT 
TATCAATTCC 



4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4360 

4920 

49B0 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 
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(2) INFORMATION FOR SEQ ID NO: 191: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14 078 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND ED NESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: £ 
TGGACTATTA ACGGCGaAGA AGATTTAACG 
AT CACAG ATG ACCCAGCATT AGCTGATCAG 
TTCGATCGTT CTATAAGAAT TTTGTTTGAA 
AGATGATACC TTCAGAGGTC TTTTTAATGT 
TCGTTTATAT TCATATGACA AGTATTTGTA 
ATTTATTGGT GAATTATTAA TTGTTTTGTG 
TACTTTCTAA TCTTTGTTTC GCTTTAGTCA 
ATTTTGCAAT ATAGTGCGCA CTAAAATATC 
CGATAATTTA TTTAAGTCAG TGTTTGCTAT 
ATGTTGATAC GTATGTGATG TAGTTTCAGA 
AAGGAGCGCC GCTTTAATAC CAGCAACTAA 
GCTTTGTTAC TCCTTTGATG TACATTAATC 
AGCTAATTAA CTATAACAAA AAGATAGTTA 
TAATGTCTTT TAATATTTTG TTTCTTTAAT 
TAAAAAATTA TGAAAAAGCA AATAATTTCG 
TTTACATGGG ATAACAAAGC AGATGCGATA 
GTTAATGCTG GGAGTAAAAA TGGGACATTA 
TATTATTTGG AAGACTATAT AATTTATGCT 
GATAATATTT ATAAAGAAGC TAAAGATAGG 
TATCTTTTGG AGAGAAAGAA ATCTCAATAT 
AAAAAAGAAA ATCCTCGTAC AGATTTAAAA 
GAACTTTCGA TGAAAGAATA CAATGAACTA 
TTTCACAGAG AAGTTAAAGA TATTAAGGAT 



!EQ ID NO: 191: 

AAATACTTAC AAACCAATGT TGATGGTATT 
ATTAAAGAAG AAAAGAAAGA CGAAACATAC 
TAATATAAAC AAAGACCTCT AAAGTTATCA 
TGCCATCTAT GGGATAGGCA ATCGTTTCAT 
TGGCAATTTG GCGTCACAAA CACTTACATG 
AATGCAAAGG GTTAGAAATT GAATTGTAAA 
TTTGATCCAA ATTTTTAGTG CGTATAGCGG 
GCGTTTTTGA AACGCATCTA AATTTAGGTA 
TAATTCATGT AATTGATCTA CAAGCGCTTG 
TTTGCTTGCT AATTTAATAC CAGTCGTATC 
ATATGTTTTG ATTTTCATTT GTGTTGTCAT 
AAAAAAATTA TACACTATTG TATATTGCAA 
ATGCTTTGTT TATTCTAGTT AATATATAGT 
GTAGATTGGG CAATTACATT TTGGAGGAAT 
CTAGGCGCAT TAGCAGTTGC ATCTAGCTTA 
GTAACAAAGG ATTATAGTGG GAAATCACAA 
AT AG AT AG CA GAT ATTTAAA TTCAGCTCTA 
ATAGGATTAA CTAATAAATA TGAATATGGA 
TTGTTGGAAA AGGTATTAAG GGAAGATCAA 
GAAGATTATA AACAATGGTA TGCAAATTAT 
ATGGCTAATT TTCATAAATA TAATTTAGAA 
CAGGATGCAT TAAAGAGAGC ACTGGATGAT 
AAGAATTCAG ACTTGAAAAC TTTTAATGCA 
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GTTGTATCAT ATTATGGTGA TAAGGATTAT GGGGAGCACG CGAAAGAGTT ACGAGCAAAA 
CTGGACTTAA TCCTTGGAGA TACAGACAAT CCACATAAAA TTACAAATGA ACG T ATT AAA 
AAAGAAATGA TTGATGACTT AAATTCAATT ATTGATGATT TCTTTATGGA AACTAAACAA 
AATAGACCGA AATCTATAAC GAAATATAAT CCTACAACAC ATAACTATAA AACAAATAGT 
GATAATAAAC CTAATTTTGA TAAATTAGTT GAAGAAACGA AAAAAGCAGT TAAAGAAGCA 
GATGATTCTT GGAAAAAGAA AACTGTCAAA AAATACGGAG AAACTGAAAC AAAATCGCCA 
GTAGTAAAAG AAGAGAAGAA AGTTGAAGAA CCTCAAGCAC CTAAAGTTGA TAACCAACAA 

GAGGTTAAAA CTACGGCTGG TAAAGCTGAA GAAACAACAC AACCAGTTGC ACAACCATTA 192 0 

GTTAAAATTC CACAGGGCAC AATTACAGGT GAAATTGTAA AAGGTCCGGA ATATCCAACG 1980 

ATGGAAAATA AAACGGTACA AGGTGAAATC GTTCAAGGTC CCGATTTTCT AACAATGGAA 2040 

CAAAGCGGCC CATCATTAAG CAATAATTAT ACAAACCCAC CGTTAACGAA CCCTATTTTA 2100 

GAAGGTCTTG AAGGTAGCTC ATCTAAACTT GAAATAAAAC CACAAGGTAC TGAaTCAACG 2160 

TTAAAAGGTA CTCAAGGAGA ATCAAGTGAT ATTGAAGTTA AACCTCAAGC AACTGAAACA 2220 

25 ACAGAAGCTT CTCAATATGG TCCGAGACCG CAATTTAACA AAACACCTAA ATATGTTAAA 22 80 

TATAGAGATG CTGGTACAGG TATCCGTGAA TACAACGATG GAACATTTGG ATATGAAGCG 2 34 0 

AGACCAAGAT TCAATAAGCC ATCAGAAACA AATGCATATA ACGTAACAAC ACATGCAAAT 2400 

GGTCAAGTAT CATACGGAGC TCGTCCGACA TACAAGAAGC CAAGCGAAAC GAATGCATAC 2460 

AATGTAACAA CACATGCAAA CGGCCAAGTA T CAT ACGGAG CTCGTCCGAC ACAAAACAAG 2 520 

CCAAGCAAAA CAAACGCATA TAACGTAACA ACACATGGAA ACGGCCAAGT ATCATATGGC 2580 

GCTCGCCCAA CACAAAACAA GCCAAGCAAA ACAAATGCAT ACAACGTAAC AACACATGCA 2640 

AACGGTCAAG TGTCATACGG AGCTCGCCCG ACATACAAGA AGCCAAGTAA AACAAATGCA 2700 

TACAATGTAA CAACACATGC AGATGGTACT GCGACATATG GGCCTAGAGT AACAAAATAA 2760 

GTTTGTAAGT CTATCCAAAG ACATACAGTC AATACAAAAC ATTACGTATC TTTACAACAG 2820 

TAATCATGCA TTCTATGATG CTTCTAACTG AATTAAAGCA TCGAACAATC GGAAGCATAT 2880 

TTCTAAATTA TTTATTCATT ATAGTCTTAA ACATAACATG ACCTAATATA TTACTAACCT 2940 

ATTAAAATAA ACCACGCACA TCTAAGTGAT ATACGACAAT CACAGCAATA ATAATTGCTT 3 000 

TAGAAAGTCG TGCCGAACTG GAACTTACAA GTCTAGTTCG AACACACACT GATGTGAGTG 3060 

50 GTTTTCTTTA TTTTAAACAT GAACAATCAG ATAAGTTACT AG CATT AG CA AATATTATTA 3120 

AATCAAAGGG CTTCGATTCA TAAAATTTAA AACAATGATT AAAATTAGAC GTGTAAATGT 3180 
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TATTTCACAC AGCTTCATTA ATAAAACGAA ATTGCTTCAA CCCGCTTCAA CTTCAACTGG 3 3 00 

CTTCAACTTC AGCCTACTTC ATTCAATAAC AAAACGAATC CGCTTCATCC AAAATCAACC 3 360 

ATTCTAACGC ACATATTCAA ATATAGCAGC TGCACCCATG CCGACACCAA TACACATCGT 34 20 

AACCATGCCG TAACGGCTAT CGGGACGTCT ACCCATTTCA TTAAGTAAAC GCGCGGTTAA 34 80 

CATTGCGCCT GTAGCACCTA ATGGATGACC TAAAGCAATA GCGCCACCAT TCACATTCG7 3 540 

ACGTGATATA TCTAGACCTA CTTCTTTAAT AGATGCAATC GTTTGAGAAG CAAATGCTTC 3 600 

GTTCAATTCG ATCAAATCAA TGTCTTCAAC AGATAGATTG CTGAGTGACA ATACTTCAGG 3660 

AATCG CAT AT GCAGGCCCAA TACC CATAAT TTTCGGGTGA ACGCCTACTG CCTTAAAACC 3720 

AACGAATCGT GCAATAGGTG TCACGCCGAG TTCTTTCACT TTATCTCCAG ACATTAAAAC 3780 

TACAAATCCT GCACCATCAG AAAGTGGGGC AGATGTTCCT GCAGTCATAG TGCCGTCAGC 3840 

TTTAAATACT GTACGTAATT TGGCTAATGC CTCCATCGTG GTGTCAGGGC GTATAAATTC 3 900 

ATCTTGGTCA AAGATATTTG TGTGTACTTT TGGTCCTGCG TTTGTATATT CAACTGAGTT 3960 

TACTTGTATT GGAATAATTT CATCTTTGAA CCGACCATCA CGTTGTGCGT CATAGGCACG 4020 

25 TTGATGACTT CTGACAGCAT AAGCATCTTG ATCTTCGCGT GATACGTCAA ATTGGGATGC 4 080 

TACATTTTCA GCAGTTAAAC CCATAGGATA TGACGCACCT ATATCATCAT ATTGTAAGGT 4X40 

TGGATTGTTT GTGGGCTCGT TGCCACCCAT TGGTACGGCA CTCATCAATT CAACGCCACC 4 200 

30 AGCTACAAGT ATATCTCCTT GACCAG C CAT AATTTGATTG GCTGCAATCG CGATGGTTTG 4260 

TAATCCTGAT GAGCAGTAGC GATTCACTGT TTGACCCGGT ACCGTGTCAG ATAATCCCGC 4 320 

ACGCAATGCA ATCGTTCGTG CAATGTTTTG GCCTTGTAAT CCTTCTGGAA AAGCCGTACC 4 3 80 

AACAATGACA TCTTCAATCA TATTCTTATT GAATTTTCCG TCAATACGTT TCAATACGCC 4440 

TTGTAATACT TTGGCTGCGA CATCATCAGG TCTTTCGTGG AATAATGCGC CTTGCTTTGC 4 500 

TTTCGCTGCG GCTGAACGCC CATAAGCTAC AATGTATGCT TCTTGCATGG TTATCATCCT 4560 

CTCTTAATGA CTATCTTTTA ATTACGTAAT GGCTTACCAG TTTTTAACAT ATGTGCAATT 4620 

CTTTCATATG ATTTTTTAGA TTTTAGTAAG TCAATAAAGC CAATTTTCTC CAACGATTGA 4680 

ATGTAACGTT GATTGATAAA TGTATTTCTT GGTAAATCAC CACCCGCTAA AATTGTGGCG 474 0 

ATATTTAAGG CAATATGATA ATCATGGTCG CTAATAAAAT GACCCCGTCT TTGCGCATCT 4800 

AATTGTCCTT GGATCAATGC TTTGAAGTCT TCACCTAAAG CGATATATTG ATGTCTAGGA 4860 

SO TTCGGAATAT AGTTTGTTTC TGCTTCATAT TTCGCACGTT TGAGCGCAAC TTCGACACGT 4920 

TGTGCTGTAT TGAAAATAAT CGTATCTGTA TCACGTAAAT AACCATAACG ACGTGCCTCA 4980 
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TG TTTGTCAT CAAACTTATG CGATGTGCGT AATATGCGAT CAGCCATTTC TGCAAGGCCA ' Si 0 

CCGCCACTCG GTAATAAGCC AACACCTGCT TCAACAAGAC CGATATATGT TTCACTTGCA 5l6 

GCGACAACAA TAGGTGAGTA AAGTACAAGC TCACAGCCAC CGCCTAAGGC ACGACCTTGA 522 

A C AG CTGTGA CTACTGGTTT CAAACTATAC TTCAAACGAT TAAAGCTATA ATGTAATTTA 528 

TCAATTGATT GTGCAACGAC ATCATCTACA AGACCGTCTT CATGCGCCTT TTTCATTAAG 534, 

AAAAGGTTAG CACCCACACT GAAATTGTTA CCATCTGCAT AAATAAC CAT ACTTGTGTAA 54 0 1 

TGGTCATTTT CCAGTAAATC AATCGCATCA ACTAACGCAT CGTTGAATTC ATCGGTAATG 54 g, 

ACATTATTTT TACTTTGTAA TTTCAGTAAC AGTTGATCAT CATGAGTTAC GGAAAGTTTG 552 ( 

G CATCAC CTT TATCCCAAAG TTCATCTTTT ACGAAGTGAG AAATAGGTGT TGCATATTCA S5 8 ( 

ATGGTCTCAT CTTGTTTATA AAAGCCACCA TCTAAATCAC TAATCCATTG TGGTAAGTCT 564 £ 

20 CCAAGTTCGT CTTCCATACG TGTTTTAACA CGTTCGTATC CCATTGCATC CCATAATTGG 570C 

AATGGACCAA GTTTCCAGTT GAACCCCCAG ACAAGCGCAC GGTCTATGTC TCGGAAATCA 576C 

TCGGTAGCTT TAGGTACATT GATAGCAGAG TAATAGAAAT TATTACGTAA TGTCTCCCAT 582C 

25 AAAAATAGTC CCGCTTCGTC TTGCGCATTG AATATGGTAT CAAGGTTATG CACTAAGTCT 588C 

TTATTAAATT CATTTAAAAT TGGTAATTGT GGTTGGGATA CAGGTACATA ATCTTGTTTT 5940 

TCAACATCGT AAACAAGTCG AGCTTTAGTT TCTTTATCCT TTTTGTAAAA TCCTTGTTTC 6000 

GTTTTACGTC CGAGTGCGCC ATTGTCAAAC AACGTATTTA CAATTTTGAC ATCATGAAAA 6060 

TAAGGTGTTT CTTCAGGTAC TTGTTGCATG CCTTTAATTA CAGACACTGC AATATCTAAA 6120 

CCGACTAGGT CAGATAGCGC ATATGTAC CT GTTTTAGGAC GACCAATCGC TTGCCCAGTT 6180 

AAAGCATCCA CATCTACAAT GCTTATCTTG TGTTGCTCGG CGCGATACAT AATATCATTC 6240 

ATTQTTTGCG TGCCGACTCT ATTTGCGACA AAGCCAGGCA CATCATTGAC GACAATGACA 6300 

CCTTTACCTA ACACATTTTG CGCGAAATTT TTTACATCTA ATATAATAGA TTCCTTCGTG 6360 

TGTGACGTAG GTATTAACTC CACTAATTTC ATAATACGTG GTGGGTTAAA GAAATCTAGA 6420 

CCAAAGAATC GTTCTTGATC CTTCTCGTTA AATGCTTGAG CAATCGCATT AATTGGAATA 64 80 

4S CCTGATGTAT TTGTAGCGAA TAAAGCATCT TCTTTAGCAT GTTGTAGAAC TTGTTGCCAA 6540 

ACAGCATGCT TAATTTCAAT ATCTTCTTTG ACTGCTTCGA TATATAAATC AGCATCATCA 6600 

TTTACCAAGT CATCATCAAA ATTACCATAT GTTAAATGAC TCGCTAGATT TAAGTCGAAT 6660 

50 AGTAGCGGCC GTTTCTTATC TGTAATTTTA TCGTAAGATT TTTTCGCAAT GAGATTTGGA 6720 

TCGTTTTTGT CCACTACAAT ATCTAATAGT TTTACTTTAA GTCCAGCATT CACAAAAAGT 6780 
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GTGATTCCTC CAATTTAGTT GAGGATAAGA TAACCATTAA GATAATTGGA ATAACGTTGC " 6900 

TATTTTATAA AATTAATTAA GTATCTTTGA CAGTCATCTT AG CCTCTTAT TTAAGGAAAA 6960 

AGCTTTATGC TTAAAATAAG T C TTTTT T A G TGAAATTAAT GCATCTCATA TAATTATTTG 7020 

CTATTTATAC GAAAGCAGAA TCTCCAGTCA AAGCGCGTCC AATTACTAAG GCATTAATTT 7090 

CATGTGTACC TTCGTACGTG TAAATCGCTT CTGCATCAGA GAAGAAACGT GCAATATCAT 7X4 0 

AATCGTCAGC TAGTATGCCA TTACCACCTG TAATACCGCG GCCCATAGCT ACTGTCTCAC 7 200 

GCAAACGTAA GGCATTCATC ATCTTCGCCG TTGAAGTTGC AACCTCGTCA TATTCACCAT 7260 

GTGCTTGCAT ATT AG CTAAT TGAGCACATG TTGCCATTGC TTGAGCTAAA TTACCTTGCA 7320 

TCATTGCTAG CTTTTCTTGT ATTAACTGAT ATTTACTAAT TGGTTTGCCG AATTGcTTAC 73 80 

GCTCAGTGAC ATAATCTAAT GTGGCACGTA AAGCGCCAGC CATACCACCT GTAGCCATAT 744 0 

AAGCAACGCC TGCTCTCGTT GAATAAAGAA TTTTGGCAAT ATCTTTAAAG CTTGTTATGT 7500 

TTTGTAAGCG ATCCGCTTCA TCTACTTTGA CATTAGTTAA TTTAATTAGG GCGTTAGGAA 7560 

CAATGCGAAG TGCGATTTTA TTATCAATGA CTTCAATATC GACGCCATCT TGTTCTGGTC 7620 

25 TGACTACAAA GCAATGGGGT TTGCCAGTTT CTTTATTTAC TGCGAATACT GGAATGACAT 76 8 0 

CAGATACATG TGCACCACCA ATCCATTTCT TTTCACCATT GATAACCCAA GTATCGCCTT 7740 

GGCGTTCAGC GACTGTTTCA AGACCTCCCG CAACGTCCGA ACCGTGTTCT GGTTCAGTTA 7800 

30 AAGCAAAGCA TGTACGCAGT TCATGTGACT GTAATTTAGG TACATATTTC GCAATTTGTT 7860 

CTTTGCTACC TCCGAAATAG AAAGTGTTAT GCCCTAAACC TTGGTGAACA CCGAGTAGGG 7 920 

TAGCTAAGGA AATATCAAAT CGCGCGAGTA GGTAAGACAT GAAAAACTGA AATAGTTGAC 7980 

TAGGCATTTT GGCGTTTGGA CGATCCTTGT AAAGTAATGG ATTGTTAAAA TAATTTAATT 804 0 

CTC&AGATC TTTAAAATAG TCCTCGGGTA CAGTAGCGTC TATCCAATGT TGATTAATAT 8100 

TTTCACGGTA CTTACTTTCT AGCAATGAAT CTACTTGTTG TAAAAATTCG ACTTCACCGT 8160 

CTGTTAAACC TTTAGCAATA CTAAGTACAT CTTCAGGAAA TAATGTTTTT AAGACCGTTT 8220 

CTTTTTCAAA TGTCATATAA ATTCCTCCTA AAAATAATAT GAATACTAAT GTGAAATGCA 8280 

TTTAATTCAA AAACAACACG CTTTATTTGT AAACGCTTAC ACTAAATGTC AAAAATTTTT 834 0 

ATCACCTTTA AAGTGTTTGC GAGACTTTGT CATTCATCAT TTGTCGAATC GCAAGTTTAT 8400 

CTGGTTTCTG CGTACTGTTT AACGGCATAT GTGTCACTGG TACATACATT CTTGGGACTT 8460 

so TATAACCTGC TAAACGACTt CGCATATGTT GATTTAAAAT TTCAGCGTAA TGAGGTTCAT 8520 

CTTCGCGAAG TATAATGGCT GCAGCAATTG ATTCACCATA TTTTGGATGA TCATAGCCAA 8580 
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AGACATTTTC GCCACCAGTT 


ATGATTAATT CTTflTTGCG 




. AATATATCGC 


8700 




CATCGTTGTC 


■ CATCTTCGCT 


AAGTCAC CAG 


> TTAATAAATA 


x VvVjnVvWt A 


AA 1 v*V- ill 


8760 


5 


CAGTCTCTGC 


' TGGTTTATTC 


CAATATCCTG 


GCGTGACATT 


AAA nUv. 


All uw\Au 1 1 


8820 




CGCCAATCTC 


ACCAGTAGGT 


ACTTCCTCAC 


CGTTATCATC 


AAGGATAr^T 


OLn 1 \_rw-\\— vj>v 


8880 


10 


ACATGACTGC 


TTTACCAATA 


CTCATTGGCT 


TACGTTTTGA 


f\ A A A A W*wVl\J A 


c^t a ttb araa 


8940 


GTACAAGAGG 


TGCTTCAGTT 


AAACCATAGC 


CGTTAATAAT 


vj a a 


Inl IVjI 1 1AA 


9000 




AAGCTGCTTG 


GATACTTGGT 


AATGGTTGTG 


AACCACCTTG 


GATGATATAA 
wA A un AAA 


1 k-UnlAuV. 1 V_ 


9060 


15 


TAAAATTTTC 


AGGATTAAAA 


TTACTAG CAC 


GT AG CGT ACT 


ATA ATA r 1 ATT 


<j 1 UUOAA ICA 


9120 




TGATAATAAA 


TGTAGGGTGA 


TATTGTGCAA 


TCATGTCATT 




f^t'W "1 "l l J\ T\ TV /*<>T< 

l. ujhaaagt 


9180 




AACGTTGAAG 


AATAAGTGTG 


CCACCTGACA 


TTAATACTGG 




T*/*^/-' *' 1 ^* 1 1 TV TV TV f*r* 

1 UGTTAAACC 


9240 


20 


CTAAAACATG 


GAACATTGGT 


GTTGATACAA 


TCGTAATATA 


w A A A unn 1 A\j 


& 7A 1 " 1 ' TV T* IV /**V*» 

AALiTATACG 


9300 




TCAGCTCTAA 


GTTTGCACCG 


TTATGAACAA 


ATGATTCATA 


A vj>\0>v\k->\ JL 


ACACCTTTAG 


9360 




GTGATCCGGT 


TGTACCACTT 


GTATAAATTA 


ATGCTGCAAG 


nlV.1 A\7 1 i 


TV TV & iu i 

TCAACAGGTG 


9420 


25 


TTGCTTGAAA 


AGGTTGGTGA 


TAATCTGGAT 


TTACGATTTC 


ATP ATA TTYIP 
.ft a \_rv a n. A iuV, 




9480 




TATCCATATG 


CAATAAGTTT 


TGGTCAATAT 


CGGTGAGTGA 


>iv~ A lAAAlul 


TTTTCAGCAT 


9540 




AG AAGAG CAG 


TTTTAATTGT 


GCATCTTCCA 


CAATGGCTGC 


AATTTPTTTT 

A A A V» A A A A 


/vy»ir»PR tv r^r* 
Vjtit»i lAACiCC 


9600 


30 


GCCAATTCAA 


TGGTAAAAAA 


ACCGCACCTG 


TTTTAAAACA 


A^rAAAfaaT 


TV TA ft^P^^^ J\ JV ^Wf\ 

AAATCTAATA 


9660 




TTGCAATATC 


ATTTGGCGCA 


AAAATACCGA 


TAACATCGCC 


a a A A A innLn 


PPTTV TV TV TP 


9720 


35 


TTAAATAATG 


TGCCATATTA 


TCAGCGCGTG 


CATTGAGTTG 


TTGGTATfiTr 


vAAvjAIuA a 1 


9780 


GTTTTGCGTG 


ATCAATAACG 




CATCATCGAA 


GTCTOAArfir' 








GCAGGCTTGT 


VjI 111 lAXLv. 


9840 




AATCGAAATT 


CATTAGTATA 


CCCCCTTTAG 


CTTCACTTTC 


A AAA n- A W 




9900 


40 


TTAAGTTGTC 


CCCATTTTTC 


TTTGTAAATG 


CTGGTATCAA 


TTA ATTTT A A 


ATY1 ATP A /if"* A 


9960 




ATAATTGGTT 


TAAAAGCCAT 


TTGATTCAAA 


ATATCTTTAT 


GClAAATCAAfl 


ArrrvytTvyt 

A VJV7 A\?{JA 


10020 




ATTTCAATTA 


GTTTCAAGCC 


TTGATTGGTG 


AGTTCGAATA 


a vav-AVvuni »— 


ArtT A A f* A A & & 
nuinnUiAnn 


i f\ n o a 


45 


TAGATTTCTT GCTCGAGTGA 


TTGTGAATAT 
* ivjivjnnini 


TGTflPATTAA 




\j w 1 v~Av»A 1 vTT 


10140 




GATACAAATT 


TCTGGTTTTG 


TCCTTCAGTT 


TCAATGTTTA 


ATCGTTGATT 


ATGGCATGAG 


10200 




ACATGACTGC 


CAGCTACAAA 


AGTACCTGAA 


AAGATAATTT 


TATTTACAGA 


TTGCGTAATG 


10260 


SO 


TCTATAAAGC 


CACCACATCC 


ATTTAGTCGG 


TCATTGAAGT 


AAGACACGTT 


GACATTGCCG 


10320 




TATTGATCAA 


CCTCAGCAAA 


GCTAAGATAG 


GCAACTGATA 


CACCATTGTT 


ATAAATAAAA 


10380 
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20 



25 
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SO 



CGACTCCCAA 
ACACATTCTT 
GTATCGCCAT 
GGTAATGCGG 
TGACTTTGAA 
AGATTTCCTG 
ACTTGTACAA 
CTCAAGTACG 
AGTAGTGCCA 
ACTAATGAAA 
TCAACAGCTG 
CGATAATGAG 
ATTGcTTGTG 
CGACGTTCTA 
AATATAAACG 
AGAACTTCGG 
TTAATGATAT 
TTTGATAAAA 
GACGTTTAAA 
TTTTGATGGT 
ATACTTATAT 
ATGAAATACA 
ATATTAAATT 
TAATCATCGA 
TACAGGTGAA 
TAATGAATCT 
TTTAAAAAAC 
GGGCAATGAT 
GCATACTAAA 



CGAATCCACC 
CATGCAATAA 
AAGTTAAAAA 
GTTCAGGTAT 
TTACTTGGCG 
GGATAACAAC 
TAACTTTCCC 
CTTCTTGAGT 
CATCAACGCT 
CTAAATCATC 
TGTTTAATCC 
TTGCAATGAT 
CCGTTTTGGA 
TAAAATCATC 
TTAAATCATT 
CGGGTAAGTT 
GTTGTAAGTC 
TATAGCGTTT 
ATCAATTAGA 
CGATAACAAT 
AAAAATATTG 
AAGTGCCCAA 
AAAATAGTTT 
AOAAATACAG 
GAGGGGATGT 
ATCGATAAAC 
GAAGCAAGAA 
GAAAGCTTAA 
AACGAAGCAG 



GAAAATG CCA 
ATTAGAGAGT 
CTGAGCAGCA 
TCCATCAATT 
GTGATTCTTT 
TTCATTCGGT 
ATGATTGGCT 
TAAATAAATG 
AGGGAATGTG 
CGTTGTTCGT 
GATTTTAGTA 
ACCTTGTGGT 
AGAAG CCGTT 
TAAATCCGGT 
GGGCGTATGA 
GGCTACAGCT 
GTGCCATGTG 
TTACACTTTG 
AATATCTTTT 
TGTAATATCA 
TTCGGAATAT 
TCGAACAAAG 
TATTATGAAA 
AAAAAGAAGA 
CATCAGCAAG 
AAATGGAAGC 
GTTTATTTGA 
ATCTTAATTT 
ATGAAATATT 



ACATCTAAAA 
TCATTATTGA 
CGTCGGAGAA 
CGTTCTTCTC 
TCATCTTCTG 
TTTAGTTGAT 
TTCGCGTTTA 
TTACCTTGTT 
TAATGTAAGT 
GTATTTACTT 
ATAACTCCAG 
AAAAAATAAG 
AAAATACTCA 
GCGGCACCTA 
TATGTGTCAT 
AATGCTGGTA 
ATTTGTTTCA 
TGTAAACCCT 
TATTCTGATA 
AGGGTTTGTA 
AAAAAGTTAA 
TATTTATATT 
AGTGAAAGTA 
GACAACACAA 
TACACAATCA 
TAAAGCGCAT 
TAATGCAACC 
AAAAGATATG 
TATAGCGGGT 



TCGGTTGCAC 
TGCCATAACC 
TCAATTTGCG 
CAGACAAGGC 
TGACGTATAC 
AGTCGTCAAC 
ATGCGACATG 
GATCTGCGTA 
ATGTTTCATC 
TACCGCCACC 
GTAATAATTG 
CTTCAATGTC 
TAATGACACG 
AACTATGAAT 
GTTGCGCTAA 
AACCAATCAC 
AG CAAGTCAC 
TaCAAGAAAT 
ATAGACACAG 
ATGAATTGAA 
ATAGGTTTTG 
AAAATATGGA 
GGTAAGTCTA 
ACGCAATCaG 
ACTAAGACGT 
GAAACAGCGC 
AAATCAATCG 
CTTTCTGAAG 
ACTGCTAAAA 



ATCATGTTCA 
GATGCTAATT 
ACTATTAAAA 
TGGTAAATAA 
ATAATCGACA 
TAAAGCTTTA 
ATAACACTCG 
TGTTCCTCTC 
GTTGATGGTT 
GTATCTAGGA 
ATTACTCTGA 
ATTATTTTTC 
TTTAATCATG 
ATCATTCG CT 
CACAGCACGT 
ATCACCATCT 
CTCCATCACA 
ATAACATAAC 
TATAGACACA 
TATCATTAAA 
ATTTTTAAAT 
AAATCCATCA 
TGGAAGGTCT 
TTGCACCTAA 
CCGACATACA 
AAAATACAGA 
GTAGACTAGC 
TATTTAAGCC 
CTACGCCAGC 



10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 
11880 
11940 
12000 
12060 
12120 
12180 
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TTTCACAGTA ACATTTATTG 


f GATTATGGGT 


CATGGCAGCA 


ATTTTTAATA ACACTAACGC 


12300 




GATTCCGGGT CTCATTTTTA 


. TAGGGGCTTT 


AACAGTACCA 


TTATCGGGTT 


TGTTCTTCTT 


12360 


5 


TTATGAATCA AATG CGTTT A 


AAAATATTAG 


CATTTTTGAA 


GTTATTATCA 


TGTTCTTTAT 


12420 




TGGCGGCGTA TTTTCATTAC 


TAAGTACGAT 


GGTATTATAT 


AGATTTGTCG 


TTTTTAGTGA 


12480 


10 


TCAATTCGAA AGGTTTGGTT 


CTTTAACATT 


TTTCGATGCA 


TTTTTAGTAG 


GATTAGTTGA 


12540 


AGAAACTGGA AAAGCACTCA 


TTATTGTTTA 


TTTCGTCAAT 


AAATTGAAAA 


CAAATAAGAT 


12600 




TTTGAATGGA TTATTAATCG 


GTGCTGCTAT 


TGGTGCAGGG 


TTCGCAGTTT 


TTGAATCAGC 


12660 


15 


AGG TT AT ATT TTGAATTTCG 


CTTTAGGAGA 


AAATGTCCCA 


TTATTAGATA 


TTGTCTTCAC 


12720 


ACGTGCGTGG ACTGCGATTG 


GTGGTCATTT 


AGTTTGGTCA 


kCGATTGTTG 


GTGCTGCAAT 


12780 




AGTTATTGCG AAAGAACAGC 


ATGGCTTTGA 


ATTCAAAGAT 


ATTTTTGATA 


AACGCTTTTT 


12840 


20 


AATATTCTTT TTATCAGCCG 


TTGTTTTACA 


TGGCATTTGG 


GATACATCTT 


TAACTGTACT 


12900 




TGGCAGTGAT ACGTTGAAAA 


TATTTATTTT 


AATCGTTATT 


GTGTGGATAC 


TTGTATTCaT 


12960 




TTTAATGGGG GCAGGTTTAA 


AACAAGTGAA 


TTTACTGCAG 


AAAGAATTTA 


AAGAACAACA 


13020 


25 


GAAAAAAGTA GACGAATAAT 


AATTAAAGCT 


TATGTTGCTC 


ATATGTTTGT 


GACATAAGCT 


13080 




ATTTTTATAA TTTGTCTTTA 


AAAGAGTGGA 


ATAGGAATAC 


TTTTTGGAGT 


TAAAAAAGTG 


13140 




TT t CACGTTA AACAAATAG T 


GACAATTAGA 


TTTATATAAA 


ATGAACATGA 


TTCACTGAAA 


13200 


30 


GTATGTAATA ATCATTTTAT 


TGAAATTCAT 


CAAACAGAAA 


TTAATACAAT 


CATATAAGCA 


13260 




AATTAAACCA CGCCATAATC 


ATATTGGATG 


ACTTCGGCGT 


GGTTTTTATA 


GTTGAAGCAG 


13320 




GGCTGAGACA TAAAT CAATG 


TCCCACACTC 


CCTTATCGTT 


CAATCGTTGT 


TCGATAATCG 


13380 


35 


ATTAAATAGA TACCTTCAGG 


TGTTACTTTA 


TAATTTTTAA 


CCTTAGAGTT 


AGCAGCGACT 


13440 




ATTUjATCGT TGTAAGCAAT 


ATAACTGTTT 


GGTACATCTC 


GACTTGATAA 


TTTAATAATA 


13500 


40 


TCATTAGAAA TATTGTGACG 


TTCCTTAACA 


TCTACAGTAT 


GATTCAATTG 


ATTAATTAAA 


13560 


TCATCGACGT TGCTATTATT 


GTAGTCTCCT 


TTATTAATAG 


CACCATCTTT 


TTTATATGCT 


13620 




TGATTAAAGA AATAACCTGT 


ATCTCCACGA 


GGAATTGTTC 


CGAAACTATA 


CATCGTTGCA 


13660 


45 


TCCCATGCAG AACGGTCTTT 


TAAGTAACCT 


TCTATGTCAT 


CAACACTTTT 


AATGTCGATT 


13740 




TCAATATTTG CTrTTTTAGC 
CGACCGTCAT ACGTAATTAA 


ATCTGATTGT 


AATACTTGCG 


CAATTTTCGA 


TAGCTCTGGA 


i Ann 

1JOUU 




CTTAATTTTT 


AAAGGGTGTT 


cttttgtata 


ACCATCTTTA 


13860 


50 


GCTAATAACA TTIITGCTTG 


TTCGATATTT 


TGTTTGGTTA 


ACTTAGGTTC 


TTTAATATAT 


13920 




GGAATTTTAT CATTAAATGG 


ACTCGTTGCA 


GGTTTCGCAT 


AACCTTGATA 


AATATGATCT 


13980 



55 



BNSOOCID: <EP 078€519A2_I_> 



894 



EP0 786 519 A2 

TTATtAGTAT GATTATACAT AAGTaAGAAG TTCTAAAn 14078 
(2) INFORMATION FOR SEQ ID NO: 192: 

5 (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 486 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 192: 

js TGAAAACTAA AGTGTTTCTA ATGCGTGACT AAAATTAGTA ATAATTAAGT TCTCATGATA 60 

ATAGGTATTT TTGAAAAATG GAGGAGTCTA TAAATGGGTA AAAAAATGGG TCTAGGTTTA 120 
TCTATTGCAT TGGTTGTTAT TGGTATTGCC GTTGTATGTT TAATGATTTT TTCTAGTCAA 180 

20 AAAACGACTT ATTTTGGTTA TATGAATAGT AATACAAATG CAGAAAAAGT TGTCAGTGAA 24 0 

AAAGATGGAT TAGTCAAACA TAATATCAAA GTAGAACCAT CTAATGATTT CAAGCCGAAA 300 
AAAGGAGACT TTGTAAAATT AGTTTCTAAA GATGATGGGA AGACATTTTA TAAACAAGAG 360 

25 ATTGTTAAAC ATGATGACGT CCCACACGGT TTAATGATGA AAATTCACGA CATGCATATG 420. 

AATTAATAAA AAAGCATCTA TAACGTAATT TTGAAGAAGT AGAGTTATCT TCTTATGCGT 4 80 

TTTAGA 4 86 

30 

(2) INFORMATION FOR SEQ ID NO: 193: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1626 base pairs 

(B) TYPE: nucleic acid 
3S (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 193: 



45 



SO 



GAGGTCTATA 


TACAATTATG 


GTTGTTCCAG 


TTAAACGAAC 


TGATGGCTTT 


ATTACTAAGT 


60 


TTAATAGATT 


AATTGAAAGA 


CGATTATTAC 


GTCATTTCAG 


TAAAAAAGGT 


TATATCACAT 


120 


GGGAGGAAAA 


TTGATTGTCT 


GACATTTTAA 


AATGTATCGG 


TTGTGGTGCG 


CCACTTCAAT 


180 


CTGAAGATAA 


AAATAAACCT 


GGTTTTGTAC 


CAGAGCATAA 


TATGTTTCGT 


GATGACGTGA 


240 


TTTGCAGACG 


TTGTTTCCGC 


TTGAAAAATT 


ATAACGAATT 


CAAGATGTAG 


GATTAGAAAG 


300 


TGAAGACTTT 


TTAAAATTAT 


TATCAGGACT 


TGCGGATAAA 


AAGGGTATTG 


TCGTCAATGT 


360 


CGTGGATGTA 


TTTGACTTTG 


AAGGATCATT 


TATTAATGCA 


GTTAAACGTA 


TTGTCGGAAA 


420 
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(A) LENGTH: 635 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 
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TCGAGTTAAA GAATGGTTAA AACGAACAGC AAGAAAATAT GGTTTGGAAG CTGACGATGT 
CGTATTAATT TCAGCTGAAA AAGGCTGGGG CATAGACGAC TTATT AT CAT CAATTGCGAA 
TATTCGAGAA AATGAAGATG TGTATATTGT AGGGACAACG AATGTTGGGA AATCTACATT 
GATTAATAAA CTGATTGAAG CTAGTGTTGG TGAAAAAGAT GTAGTAACAA CTTCAAGATT 
CCCTGGAACA ACTTTAGATA TGATAGATAT TCCTTTAGAT GAAACATCAT TTATGTATGA 
TACACCAGGT ATTATTCAAG ATCACCAAAT GACGCATTTA GTTAGTGAAA AAGAATTGAA 
AATTATTATG CCTAAGAAAG AAATAAAACA ACGCGTATAT CAATTAAATG AGGCGCAGAC 
ATTATTCTTC GGCGGTCTAG CGCGCATAGA TTATGTATCA GGTGGTAAAC GTCCGTTAGT 
TTGTTTCTTT TCTAATGACT TGAATATACA TCGTACTAAm ACGGAGAAGG CTAATGATTT 102 0 

ATGGCGTAAT CAACTTGGCG ATTTATTAAC GCCACCTGGA AATCCACAAA ATTTTGATCT 1080 
20 TAATGAGGTA AAGGCTGTTA GACTTGAAAC AGGCAAAGAG AAACGCGATG TTATGATCTC 114 0 

TGGTCTAGGC TTTATAACTA TAGGACCAGG GGCTAAAGTA ATCGTTCGTG TTCCTAAAAA 12 00 

TGTTGAkGTT GTATTAAGAA ATTCTATTTT ATAAGGTGaT TAAAAAAATG AAATTTGcAG 1260 
25 TTATAGGAAA TCCTATTTCA CATTCCTTGT CGCCCGTTAT GCATAGAGCA AATTTTAATT 1320 

CTTTAGGATT AGATGATACT TATGAAGCTT TAAATATTnC CAATTGAAGA TTTTCATTTA 13 80 

ATTAAAGAAA TTATTTCGAA AAAAGAATTa GAAGGCTTTA AT AT CACAAT TCCTCATAAA 144 0 

GAACGTATCA TACCGTATTT AGATTATGTT GATGAACAAG CGATTAATGC AGGTGCAGTT 1500 
AACACTGTTT t G AT AAAAG A TGGCAAGTGG ATAGGGTATA ATACAGATGG TATTGGTTAT 1560 
GTTAAAGGAT TGCACAGCGT TTAnCCAGAT TTAGAAAATG CATACATTTT AATTTTGGGC 1620 
GCAGGT 

(2) Information for seq id no: 194 : 



1626 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 194: 

AGGGTTAATT GTCGGTTTAA TTGCAATGAA TAAGTTC CAT GTATTAG CTG GCTATAGAGC 60 

SO GAAATTCATC TTAATGGTGA TTTTAACTAT GATGGTCTTC GTACTTATTA ATACGTATTT 120 

ACTAAGACAG GTAAAATCTA TCGGTATGTT CTTAATGATT GCTGCATTGG GTCTATACTT 180 
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GTCTTATATC GATAACATGT TCTTCAATTA TTTAAATGCA GAGCATCCTA TAGGCTTGGT 300 

GCTAGTAATA TTAACAGTAC TTGTGATTAT TGGCTTTGTA CTGAACATGT TTATAAAACA 360 

CTTTAAGAAA GAGAGATTAA TCTAATGTTG ATGAATAGCG TGATTGCTTT AACTTTTTTA 420 

ACAGCATCTA GCAATAATGG CGGACTTAAT ATTGATGTGC AACAAGAAGA GGAAAAGCGA 480 

ATCAATAATG ATTTAAATCA ATATGATACA ACGCTATTTA ATAAAGACAG CAAAGCGGTT 54 0 

AATGATGCGA TTGCTAAGCA GAAAAAAGAA CGACAACAAC AAATAAAAAA TGATATGTTT 600 

CAAAATCAAG CGAGTCACTC GACTCGCTTG AATGA 63 5 
(2) INFORMATION FOR SEQ ID NO: 195: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13715 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 195: 
25 CTGAAATGGG TATTATTTGT CTTCTTCATC ATAAAGTAAT AAAGATTGTT CATCATTGCG 60. 

ACGTTGCCAA TTTTCATTTG GCGATCTTGG AACGTATAAT AATTGCCTAG TAGCATACGC 120 

TTTGATTGAA ACATACAAGT CATTCCTTGA ACTTGCACCT CAATTTCCAC ATTTGAATTT 180 

30 T CTTTT AT AT TAATAATTTC ATCCAAATTC AGCTCACGTG CTAAGACAGC TCTTGATGCG 24 0 

CCTCTTTTAC CCCAGTAATT ACATTGAAAA TGATTAGTTA CTAACGTCTC TGCATTCCAA 300 

TGAAGTGGTA TTGGATTTTC TTGCGCCTTC ACATACATTA CTACTGCTGO ATCCCCGAAA 360 

ATAATTCTGT CAACTCGTAT TTCATGTAAA AAATTAATAT AATCTTCTAC AGCATCTAAA 420 

TGATSAATTAT GAAATAATCC ATTCACTGCC GCATATACTT TTTTATCGTT TTTGTGAGCT 4 80 

AATGCGACAG CCTCTGTCAT TTGTTGTCTA TTGAATTCCC CTGGAAGTCT TAAACCAAAC 540 

TTTTGCTCGC CAATTACAAA AGCATCTGCA CCTAAATCAA TAAGTGTTTC CATATGGCTT 600 

AATGACTTGG GTGTGACAAG TAATTCTGTC ATAGTCATTC TCCTTTAATT GAAATCGCTA 660 

ATCCATCGTC TATATTTAAA AAATTCGTTG TATATCCTGG TTGCTTTATT AACCACTCAT 720 

TATAATCTTG AACCTTTTTA ACCATTTGTC TTACATTTCT CGATCTAACA ATCCCAATAT 780 

CCGATACAAA ACCGTGATAT AAAACATTAT CTGTAATTAC GAGACCTTGG TGCTTTAAAA 840 

so GTGGTGTATA TATTTCAAAA AATTTCTTTG ATTGCGCTTT TGCTGCATCA ATAAATATCA 900 

TATCATAAAC TTTGTCATTT ACATTTTCAA ATTGCTCTAA AGCATTACCT TCAATAATTC 960 
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CATTACGCTC 


TATCGTTGTG ACATGAATGT 


CATCAGATAT 


AGAAGCGAAT 


TGCATAGAAC 


1 AAA 

i-UOO 




TATAGCCGAT TGCTGTACCA ATTTCTAAAA 


TATTTITAAC 


ATTATTCATA 


CGAATTAATT 


A X *t \J 


5 


GCTTAATTAA 


ATCTAATGTT 


AAACGATCTA 


CAATTGGCAC 


TTCATTTACC 


TCGGCAAATT 


X a. \J u 




CACGCAAAAC 


TTCGATTGAA 


CTATTTTGAT 


GTTGATGTAA 


ATCTATTAAA 


TAT1TTTTAT 


1260 




TTAGGTCATC 


CATGTTTTAA 


ACTTCCTTTA 


TGTAAAATAA 


GTCAATATGA 


TTATGACAAT 


1320 

J -fc w 


10 


AAAATAAATC 


AGCCTTCACA 


ATTGATTATA 


ATTTTGCCAA 


CCAATTAAAT 


GACTGATTTC 


1380 




GTGTTAGACG 


CAAAGCTATT 


TTATTTATAG 


AAGCGAATCA 


TTCATATAAA 


ATTTAACTTT 


1440 


15 


AGATATTTTA 


C CAT ATTTTC 


AATAAAATTA 


TAAGCGTTAA 


TTATTTATAC 


ATTGCTTGAC 


1500 


TTAAAAAATA 


CTCTTGCCTC 


CCCATCTTTA 


AGGTTAGCAA 


GAGTAAAATC 


1TTTTAATTA 


1560 




TTCTTCCATT 


TCAGTATTTA 


CAACTTCTTC 


AATCATGTCC 


CATTCTTCAT 


CAGTTTCGAT 


1620 


20 


TGGTACTAAC 


TTACCACCGT 


CACCTGACTC 


ATCTGGTTCA 


TTGATCATTG 


GTACAAGCTC 


16 80 




AATCATATCG 


TCTTGATCTG 


ATTGAGCACC 


TTCTTCAGCT 


AAGATAACAT 


ACTCTTTTTT 


a / ** \j 




G AATT CAGG A 


TGATAAAATT 


CTAAAACTTT 


TCGGTATAAA 


ACTTCATTTC 


CCTCTTCATC 


1800 


25 


GAATAAAGTT 


AATAATTCTT 


CTTCGTTATT 


AATTTCTAGT 


TGTGAATCAT 


GATTATGTTC 


18 6 0 




AGTCATAGTA 


AAATCTCCTT 


TTAATGTAGT 


GAATCTAAAT 


AGCCTTGTAA 


AATAAATACC 


1920 




GCTGC CATTT 


TATCAATCAC 


TTGTTTTCTT 


TTTTGTCTTG 


AAACATCTGC 


TTCTAATAAT 


1980 


30 


GATCGTTCAG 


CAGCCATTGT 


GCTTAATCTT 


TCATCCCACA 


TCACAATCTC 


AATAGAAGGA 


204 0 




TAAGCTTCTA 


ataatttttc 


TTTATATGTT 


AACGAAGCTT 


CGCCTCGAAA 


TCCTATTGAA 


2100 




TTATTCATGT 


TTTTAGGTAG 


TCCTATTACG 


ACTGTACCCA 


CATTATGTTT 


TTTAATAATG 


2160 


35 


TCTACTAATT 


GGTCAATACC 


T AATT CATTA 


TTTTCTTCAT 


TGATTCGGAG 


TGTGTCTAAT 


2220 




CCTTGTGCCG 


TCCAACCCAT 


TATATCACTA 


ATTGCAATTC 


CTACCGTTCT 


ACTACCGACA 


2280 


40 


TCGAGTCCTA AAATTTTATG 


TTGTAACATA 


AATTATTTAT 


TTTGCTCTTT 


TAAATAGTAA 


2340 


GAAACAAGCT 


CTTCCATAAT 


AACATCTCTA 


TCAATATGAC 


GAATTTGATT 


TCTTGCTTCA 


2400 




TTTTGGCGTG 


GAATATACGC 


AGGGTCACCT 


GATAATAAAT 


AAC CT ACAAT 


TTGGTTTACG 


2460 


45 


GCATTATATC 


CTCGTTCATC 


TAATGTTCGA 


TAAACATTAT 


TTAAAACATC 


TCTTACATCT 


2520 




TGCGTTGGAA 


GTTCTTCATA 


GTCGAATTTC 


A 1 IXj 1111 AT 


CAAAGTTTTC 


CATTTGCGAC 


2580 




ACTCCTTTAA 


TTACAAATAT 


AACTCACTAT 


CATCATACAA 


TATTATGGCT 


TTAAATTATA 


2640 


SO 


GATTTTTAAT 


GTAATCTTTA 


ATAAAGCTTA 


ATGATTTTGA 


GATATTTTCA GGTTGTGTAC 


2700 




CGCCACCTTG 


AGCCATATCT 


GGACGACCGC 


CACCTTTACC 


ACCAACGATT 


GGTGCCATTT 


2760 
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TCGATACTTT 


ATCATCAACA 


TTACTTGCAA 


GAATGATAAT 


TGTATCTTGT 


AGTTTAGATT 


«oou 


TAAAATCGTC 


CATTGT CGAG 


CGAATTGCTT 


TCG CATTTGG 


TACATCCACT 


TCAGTAACCA 


* ^ *t \j 


ATACTTTATA 


GCCATTGATT 


TCTTCAACTT 


GATCTTCAAT 


ATTACCCATT 


TTAAGTGATG 


3000 


TGATTTCTTT 


GTCACGTTGC 


TCTAATTGTT 


TTAATAATGC 


TTTTTCTTCA 


TCTTGTAATT 


3060 

*J V V V 


GTGTTAACTT 


ATCGACTACT 


TGATCATCAG 


ATTTCACTTT 


CAGCTGTGAT 


TTCATCG TAT 


3120 


TAAATTTCTC 


TTGAATATCT 


TCTAAATATA 


AGAAAGCTGC 


TTTACCTGTT 


AATGCTTCAA 


3 180 


TACGACGCAC 


ACCAGCTCCT 


GTACCTGACT 


CACTTACTAT 


TTTGAATAAG 


CCAATTTCAG 


3240 


AAGTATTGCG 


GACATGAATA 


CCACCACATA 


ATTCAATTGA 


AAATGGTGCC 


ATATTTACTA 


3300 


CACGCACAAC 


ATCACCATAT 


TTTTCACCGA 


ATAATGCCAT 


TGCGCCCATT 


TCTTTAGcTG 


3360 

J w O V 


AAGCAATATC 


CATTTCTTGA 


ATGTTAACGT 


CAATACCTTT 


CCAAATTTCT 


TCATTTACTA 


3420 


AGCGTTCAAC 


TTGATCAATT 


TCATCATTAG 


TCATTGGACC 


AAAATGAGAG 


AAATCAAAAC 


34 30 


GTAAACGATC 


TGCTTCTACT 


AGTGAACCAG 


CTTGGTTAAC 


ATGATCACCC 


AGTACTGATT 


3540 


TCAACGCTGC 


ATGTAATAAA 


TGTGTTGCAC 


TATGGTTCTT 


TTGAATGTCA 


CGTCGATCAT 


3600- 


TTTGGTTCAC 


TTCAGCAGAC 


ACTGTAGCGC 


CAACATTTAC 


TTGGCCAAAT 


TGTACTACTC 


3660 


CTTTATGCAA 


GTTTTGACCA 


TTTGGTGCTT 


TGGTTACTTC 


ACTAACAGCA 


ATTTCAAAAT 


3720 


TGTCATTATA 


AACAATACCT 


GTATCCGCAA 


CTTGTC CACC 


ACTGATTGCA 


TAAAATGGTG 


3780 


TTTCCGTTAA 


CATGAAGTAT 


ACTGTTTCAC 


CCGCTTCAAC 


TTGTGAAACT 


TCTTCACCAT 


3840 


TGTATATCAA 


GTGTGTTAGT 


GTTGTTTGAG 


c t GTCGCAGT 


ATCATAACCA 


ACAAAAGTAC 


3900 


TTGCAGATGT 


AATATTTTTC 


AATACTTCAC 


TTTGAACTTG 


CATTGATTGA 


GAATTTTGAC 


3960 


GTGCTTGACG 


TGCACGATCA 


CGTTGTTGTT 


GCATTT CTGA 


CTCGAATGTT 


GTCATATCAA 


4020 


CXTCAATCC TGCTTGCACT 


GCTATTTCTT 


CAGTTAATTC 


AATTGGGAAC 


CCATACGTAT 


4080 


CATACAATTT AAATGCATCT 


TTCCCATTAA 


TTTCATTTGT 


TGTCGCTTTA 


gcttttttaa 


4140 


TTAATTCATT 


TAAAATCGCT 


AAACCATCTT 


CTAATGTTTC 


ATGGAATCGT 


. TCTTCTTCAG 


4200 


ACTTTATAAC 


ACGCTTAATG 


AAATCTGCTT 


TTTCCTTAAC 


ATTTGGATAA 


TATGGTTCCA 


4260 


TAATGTCTGC 


AACAATATCA 


ACAAGTTTGT 


ACATAAATGG 


CTCATTGATT 


CCTAACGTTT 


4320 


GACTAAAACG 


AACGGCACGA 


CGTAACAATC 


GACGTAATAC 


ATACCCTCTA 


CCTTCATTGG 


4380 


CAGGTAATGC 


ACCATCAGAA 


ATTGCAAATG 


CAATCGTACG 


AATGTGGTCA 


GCAATTACTT 


4440 


TAAATGCCAC 


ATCTTGTTCG 


TTGTTTACTA 


AATATTGTTT 


ACCTGATACT 


TTTTCGATTT 


4500 


CATTCATTAT 


AGGCATAAAT 


AAATCTGTTT 


CATAGTTAGT 


ACGTACATTT 


TGAGAAACTG 


4560 
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TATGATCTTT ATTATGATTG 


; AATTCAfTTAA 


' AlACTAAGTT 


u LATACTTCA 


AGATAGCGTT 


4680 




CATTTTCTCC 


1 ACCTGGATAC 


•«»■ X X 1V.1 XWX >J 




TTGTCCATAT 


GCTTCTCCGC 


4740 


5 


GATCATAGAA AATCTCAGTG 








CAGAAGTTAC 


4800 




CTTCAATGCG 


AATAATACGA 


CTTTnTrAA 

V* X X 1V.X x V<^V1 






ATGTTGTATG 


4860 


10 


CTTCCATATC 


TTCCGGATGA 


ATCRTAACHT 

«» x v.w X /V\\.u X 


7A 7A & ^^^H^P ft T^/ - ^ 




CCCATCCATT 


4920 


TATCACTCGT 


TAAAAATTCC 


CAAGCAAATT 


f*A ATfnPTTP 
» — tt-M X v^.Ljv>. 1 IL 


l rtj ill AAAA 


TAATCAC CAA 


4980 




TTGAGAAGTT 


ACCTAACATT 


TfJVA&G A 2V*TTS 

X ^w^WWVUXVl X Vj 


x >\ X \jg\j 


CG CTGTG AAA 


CCAACATTTT 


5040 


IS 


CAATATCATT 


TGTACGAATA 






TCTTGGCTTT 


TTAGGTGTTt 


5100 


CACGTCCATC 


AAAATATTTC 


" 1 " 1 w I 'ft. ft. TV^^PTV? 


ft O ft r^/ "IV • ft 


ft »W^Pft ft W AAft MB 

ATTAATCCAT 


AATAATGTAT 


5160 




CATCATCAAT 


TGGCACTAAT 


GGTGCAGAAG 


GTTCAACCAT 


ATGTCCTTTT 


TCAACAAAGA 


5220 


20 


AATCTAGATA 


TTTTTGTCTA 


ATTTCACTCG 


CTTTTAACTT 


TTTCATCATT 


TAGACATCCT 


5280 




ATTTACTGTT 


TTTAAATTAC 


CATTCCATAA 


AAATTGATGA 


CACAGATAGT 


CGATTTGCAA 


5340 




AACTAGTATA 


AATCAATATC AlTmTATT ATTAAAAAAT AAAAAACGCC 


CATCCTCAAA 


5400 


a& 


AGGGACGAAC 


GTTATCGCGG 


TACCACCCTA 


GTTATAAATG 


CAATTCAACA 


CATTTATCAC 


5460 




TTTAATTCGA 


CTATACAGTT 


GTGCATAAAG 


TAGCGTTCAC 


TAATGTTTGT 


cgtacttitc 


5520 




ACCAACCAGT 


ACATCTCTGA 


TAAACAAATC 


aTTAACTACT 


CATCTTTATA 


CGAATTTAAT 


5580 


30 


TCTATTTTAG 


TTACATTTAC 


GCTTGTTGTC 


AACX3TTCTAT 


AAAGTCATAC 


GGCGTGATTT 


5640 




CTCCCATATT 


AATCATTGGG 


TCAATTTTAA 


ACATTGTAGC 


TTCCGTTAAT 


ACATTTGTAT 


5700 




CTGTTTTTGT 


TGAATCAGAC 


ATAACTTCTT 


CACTATCATT 


CGATGACATT 


GGCGCTTCTA 


5760 


35 


CTTGATCATC 


TATTGTCGTT 


TGTGAAGCTC 


CTGTATCATT AgTTGCTGTG TTTTCCAgCA 


5820 




tttcStcatc 


TTCTGAATTA 


AAATAATTTT 


TCAACAATGT 


ACATAATTGT 


GTTAAACGCG 


5880 


40 


CTTGACCATT 


TGTTTTCAAT 


CCAATATCAA 


ATGCTTCCGG 


ATCACCAAGT 


AAAACTAAAC 


5940 


TCGTTTTCGC 


TCTAGTTAAA 


CCAGTATATA 


ATATCGGTCT 


TTGTAACATT 


CTAAAATACT 


6000 




GTTTAACAAT 


AGGCATGATA 


ACAATAGGAA 


ATTCTGAACC 


TTGTGATTTA 


TGGATTGATG 


6060 


45 


TACAATAAGC 


ATGTGTTAAT 


TCCATCATAT 


CTTGTTTCGT 


AAATGTAATT 


TCATTACCTT 


6120 




CAAAATCCAC 


AACAAGTACA 


TCTTTATTAA 


GGGCATTTTC 


TTTCGCCCAA 


AAAATACCAA 


6180 




CAATAACTCC 


TATGTCACCA 


TTGAATATGT 


TATCATTTGG 


CCTATTAACA 


AGTTGTAATA 


6240 


50 


CTTTGTCACC 


TTTTCTAAAG 


ACTACATCAC 


CAAACTCAAT 


TTCTCGTGTG 


TCTTTCTTTT 


6300 




TAGGGTTTAA AATATCTTGT 


AAAACTTGAT 


TTAAACGTTT 


AATACCGGCA 


TTTCCTTTAT 


6360 
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CTACCTTCTC AACAACTGTT GGTATTTGGT TTGCCTGACA GTTAATAAAA CTTCTATCAT 64 80 

GAAAACGCTG TGTAATATCA ATTTTCTGAC CCAACTTCAT TCGATGTGCT AATTCTATAA 6540 

TGCTTGAACC ATCTTGTTGA CGATATACTT CAGTCAGATT TACTCGTGGT ATAGCTTTCG 6600 

ATTCAATTAA ATCTTTAAAT ACTTGACCAG GACCTACAGA AGGCAATTGG TCCTCATCAC 6660 

CTACAAATAT CAATTGTGCA TCTAAAGGAA CTGCACTTAA AAATTGGTGG AACAACCAAG 6720 

TATCTACCAT AGACATCTCA TCAATGATTA TGAGTCGTGC GTTTATTTCA TTTTCTAATA 6 780 

TATCCTCTGG CTTTGTGTCT TGATTCCAAC CTATTAAACG ATGAATCGTC ATTGCTTCTA 684 0 

ATCCAGTTGA CTCTTGTAGT CTCTTAGACG CTCTTCCTGT TGGCGCTGCT AATACAACTG 6 900 

GATAATCATC ATTGACATAA TCATCATAAT CTAATGATAA GCCATGAATC TCAGCATATA 6960 

ATTCAACAAT ACCTTTAATT ACTGTCGTTT TTCCTGTTCC CGGTCCACCG GTTAATAGCA 7020 

TCACCTTAGA ATTGATAGCC GTTTGCAAAG CTTCTTTTTG TGAAGCTGCA TAGTTCACTT 7080 

GATTCGCATC TTCTATTTCA CCAATATGCA TTTGTAAATC TGACTGTTCA ATTTCTGTAA 7140 

GTTTATTTGT ATGCGTCTTT ATTCTGAATA AGTTTTGAAC ACTTTTGATT TCaGAATAAT 7200 

25 ACAAACTTGG AATTGCAACT TGTTCaTTGT CAATAATTAG TCGTTTTTCC TCATTTAAGT 7260 

ATTGCAACAT TTCGTCTAAT TTTTCAGGTT CGATGACCTC TTCATCTTGa TAATTTAATA 7320 

CATCAACCGT TAAATCTATA ACAACATTGA TAGGCAAATA TGTATGTCCC TGTTTAATAC 73 80 

30 ATTCTTCTTC TAACGTATAG AG CAACGCAG CTTTTAATCG TTCATTATCG TTATAAGCGA 7440 

TACCAATATT TCTAGCAAGT TGATCTGCTT TATTAAAACC AATACCTTTA ATATCATAAA 7500 

TCAATTGATA TGGATTTCGA TCTAAAATAG TCAGTGTATC GCCGAGATAA AACTGATAAA 7560 

TTGCCATTGA AAGTTTAGGA CCAAACCCTA AATCATGTAA ACGAATCATT ATTTTTTCAG 7620 

ATTCTTGATT TGCTGAAATT TGTTCTGCAA TTTGTTTCTG TTTCTTTTTA GATAATCCCG 7680 

AAACTTTTTC TAGCACTGAA TGGTCATCTA ATATATCATT TATCGCATTG TCACCTAATG 7740 

TATTAACAAT ATTTTGAGCT GTCTTTTTAC CTACACCTTT AAACAAATCA CTAGATAAAT 7800 

AACTTATAAT TGCTTCTTTC GTTTGTGGCA TTTCTTTTTC AAAAGTCTCT GCTTTTAATT 7860 

GTTTACCATA ACOTGGATGA TCAACAACTT GCCCTTTAAA TGTGTAGACA TCGCCTTCAA 7920 

CAATATTCGG AAGAAACCCT ACAACAGTTG GCATTGTATC AAAGTCTTCA TTTGTTTCAA 7980 

TAGTATCTAC TTTAAGCACT GTATAAAAAT TATCACTGTT TTGAAACAAT ATCGCTTCAA 8040 

so CAGTACCTTT GATCATTGAA TAATCAAATA GTGTAGGGTC TGACATGTTA CTCCTCCTCT 8100 

TTCATTTTAG TGAATGTTTT CAGCGCATGC TGACTTAATA AGTGTTTAGG GTCGATAGTC 8160 
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AAGCCCAAAT TGTATCTTGC ATCAACATGA TTTTTATCAA TCGTTAATAC 
TGAGTTATGG CTTCATTAAA CATTTCTAAT TGACATAATA CAAGACCATA 
ACTTCTG CAT CTTTGTCTTT ATCTAGTTCC GCAGCAGTCA TTAAATACGG 
CTTAAATGAT TCTAACTGAT TAAACGCCAT ACCGATCATA TAATTACAAT 
AATCTCTGTT TGTAATGCTT GTTGATATAA TTTAATAGCT TCTTGATAAC 
ATAATATACA TTTGCTAGAT TAAAAAATAC GACGCCATTC TTCGGATCTA 
TTTTTGGAAA AAACGCTCTG CCTTTyCAAy CyCATTCgCA TCAGCAAGTA 
ATTAATATAA TTTTCAATAA TTGTAGGATT TTCTTCGATA TTTCCGAACA 
CGCTTCTTCT ATTTTTCCAT TTTGTATGTA TTGATAAATT GTTTGTTGAT 
CGAACCTCAT TTCTCATCAA TTATAACATC TTGATAAATT GTATGTCTCG 
CAACGAATAA AATATAATCT AATATCATCT TCATTCATGA AAAAGCGGGA 
AATGCTTAAG AACCATTAAC GGTTTATTAT GTAATGGTTC TTCCACATTA 
TTATGTACTT AAAAATAAGA ATACATAATT AGATTCATGC ATAGGGAGTG 
GATATTTTAA CAAAATTAAA TTCGTTATCC CCAACTGGCA TTGCCTGTAG 
CGAAATTCTC TATGTTGTGG TCCCGCCAAT ATAACATTGT AGAGCCTAGG 
GTCCCAGACT CTATCCTCAT GAATTATTCT CATCAAAAAC TGTCTTTCGT 
GTTGAAACTT CAAATAAGTA ATTTATTGTT GCCATTGTTT ATACAACATA 
CCTTCATTTT TGAACACATC GTCAATTGTT GCACCACCAA GACACACATC 
AAAACAACTG CTTGTCCAGG TGTGATTGCT CTTACTGGCT CAGCAAAAGT 
CAtGGtCGTT TTCACGTTTC ACAAAAACTT TCGTATCTTT TTGGCGATAT 
CTG t ACATTC AAAACCTTGA TCTAAGTCAT TATCTTCTGG ATTTACAAAT 
AAGCAATTAA GTAATCACTG TATAATGCAT CGTGATGGAA TCCTTGTTCT 
CATTATCTTT TAGGTTTTTA CCGACAACAA AC CAAGGATC GCCATCTCCA 
ATCCATGTCT TTGTCCTATT GTGTAATACA TCAAACCACT ATGTTTACCC 
CATCAAGTGT TATCATATCA CCCGGTTGTG CAGGTAAATA TTGTGATAAA 
AGTTTTTTTC GCCGATAAAA CAAATGCCTG TAGAATCTTT TTTCTTAGCA 
CTTGTTCTTC AGCAATTCGA CGCACTTCAC TCTTTTCGAT GTCGCCAATT 
CTTTTGAAAG TTGTTGTTGA GATAATTGAT TCAAGAAGTA TGTTTGATCT 
CTACACCACG TAACATTTCA ACATGACCAT CTTCATGACG ATGTATGCGT 



ATGTTTAAGT 
TTGAAATTGA 
CAATGCCAAG 
CAACTTGTTC 
GTTGCTGATT 
TTGTnAAAGC 
CGATmCCaGC 
ATGCTTGTAA 
CTATCATTTA 
AATCACTTAA 
ATGGAATAGA 
GCCACCACTA 
GGACAGAAAT 
AATTTCTTTA 
ACATTGTGAT 
CATTTTCAAC 
ATTTAATTGA 
ACCTTGATAA 
AACACGTAGg 
CTAAATTTAG 
GAATAGTCTG 
ACATATAAAA 
CCTATACCTA 
ATTTTCTTAC 
AATGTTTTAA 
GTAACAAGTC 
GGGaACATCA 
TTATTATTAT 
GCGTAATGTC 



3280 

8340 

8400 

8460 

8520 

8580 

8640 

8700 

8760 

8820 

S8S0 

8940 

9000- 

9060 

9120 

9180 

9240 

9300 

9360 

9420 

9480 

9540 

9600 

9660 

9720 

9780 

9840 

9900 

9960 
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TTTCTTTATT 
AATACGTAAA 
CAATTTGATT 
TTTCGTCAGT 
TTAAGACGTG 
TATCTTTATT 
CTACAATTGC 
GATTTGATCG 
CTGCTGTACA 
TCGTTTCAAC 
TTGAACCATT 
TTAAATTCAT 
TAGCCATCCC 
CACCGCCAAG 
CTTTTGGTCC 
ACTTAACATC 
CAGCAATAAT 
ACATraTAGa 
TAGCACCTGT 
CAAAAACATG 
GTTC3LTTTGC 
TAAATATAAT 
CTAAATATTT 
AATTGTAAAT 
AATCTGCATA 
GCACCTTACA 
TATTTTACCA 
TTGTCTTTTT 
CTATTATTTT 



ACACATAACG 
GACTTTATCC 
ACACACTTCA 
GTCATCCCAG 
GGCTGTTACA 
TGACAATTAT 
ATTAATTTCA 
CTCCTCATCT 
TGCAGATCCA 
TTCAACAAAC 
TAATTCAAAT 
TAAATGAATA 
AACAATTTGC 
TTGAGGATAA 
GCCAAACTTA 
AAGATGTCCA 
ATCTTGAATA 
TACTAAAATC 
ATCATCAACA 
TAACACAGAA 
TTTTACTATG 
TTCATGTGTA 
ACGCGCATCT 
CGTCATCATC 
AATTTCCATG 
TACTATTTTT 
TTTTCTACAC 
TATAAATTTT 
GGTTATGAGC 



TCTGGATTTG 
CAATATTCTT 
ATAACATCGT 
TTTTTCATAA 
GAACTATCTA 
GACTCCTCCT 
TTTTCAGTAG 
TCGAACATTG 
GACGACACAT 
GGAAAATATA 
GGAATCGCTC 
TTGTTATCGT 
GCAAGATTTT 
TCTAGTGTAA 
TGAGCAGTAA 
ATTGCTTGAA 
TCATAAATTT 
GTCTTATCTG 
TCTAGATATG 
TGATGTTCAA 
CCTTTAATTG 
TCTGCACCAA 
CTTCCCTTAO 
GCATCTACTA 
TTTGGACACT 
CTACTTTTCT 
ATGCTTTTCG 
AGTATTTGCA 
AATTTAATAT 



GAGTACGACC 
TTTCAAAATT 
TGTAATCTTC 
ATATGCCAAT 
CACCGCCTGA 
TAAATTTAAA 
TCAATTCGTT 
CATCTAAAAC 
AGATTTGTGC 
GATTTACAAT 
TTTCTTGTAA 
CTCGATTCTT 
CAGTGCCTGC 
CATGGTCTTT 
TACTCATTGC 
CCGCATCAAC 
GTtGCACTGT 
tAATTGTTTC 
TTACATCAAA 
TCTTCGATGT 
CCGTATTATT 
GTAATTGTGC 
CATGTATTGA 
CTTCAGGTTT 
CCTCACAATT 
GTTTAACTTT 
ATAGGCTTTT 
GATATTTTTT 
TTATCTGGTT 



TTTTTTGTAT 
AACAGCGTAA 
AGTTGCAGTA 
GACATCATAA 
CATACCAACG 
ATATATTTTA 
AAAACTAAAT 
ATGCGACGGT 
CATATCCAAC 
ATGGCCTGTA 
TTTAACTAAA 
TTCTGCTAAT 
ACGGCGTTTC 
AACTAGTAAT 
GTCGATCTCA 
ATGGAAATAT 
GCCAaCTTCA 
TTCAAGTTGA 
ACCTTCTCGC 
GATAATGTGA 
CGATTCTGTT 
AATTTGACGT 
TGATGGATTA 
TACTGGTGTG 
TTATCAATGT 
ATTTATAATG 
TTAAGTTTAT 
TATTTGTAAA 
ATTCGATTGG 



TCATCTAAGA 

TACGGAATGC 

CATACGCCAT 

CCTTGTTCTT 

ACAACACGTA 

TGAATTTCAG 

CGAATCGAAT 

TGTGTAGAGC 

AATGTTAACA 

GCATCCGTCA 

AATTGTTCTT 

TGTAATGCTT 

AATTCTTGTT 

GCACCGACAC 

AATTCGTCAA 

GCATTTGTCT 

TTATTTACAA 

TCTAAATCAA 

TCTAATTGTT 

TTACCCAATT 

GCGCCACTCG 

CTTGACTCAT 

CCATAATGCG- 

GTCGCAGCAT 

TCCAATAATA 

TTTTTAATTA 

CGCTTTATTC 

ATGTAACGTA 

TATACTTCTT 



10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
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GTCCCTATTC 


GAGAAGGTGA 


AGATGAACAA 


ACAGCAATTA 


ATAATATGGT 


TAATCTCGCA 


11 pan 




CAACATTTAG 


ACGAATTATC 


ATATGAAAGA 


TATTGGATTG 


CTGAACACCA 


TAACGCTCCC 


1 1 n 


5 


AACCTAGTAA 


GTTCAGCAAC 


TGCTTTATTA 


ATTCAACATA 


CGTTAGAACA 


TACGAAACAC 


12000 




ATACGTGTAG 


GTTCTGGAGG 


CATCATGTTA 


CCTAATCATG 


CTCCATTAAT 


CGTTGCGGAA 


12060 




CAATTTGGCA 


CGATGGCAAC 


ATTATTTCCA 


AATCGTGTCG 


ATTTAGGATT 


AGGACGTGCA 


12120 


10 


CCTGGAACAG 


ATATGATGAC 


CGcAAGTGCA 


TTAAGACGAG 


ATCAACATGA 


TGGTGTTTAT 


12180 




AAATTTCCAG 


AAGAGGTTTC 


ATTATTACAA 


CAATATTTCG 


GCCCTGCTCA 


CCAACAAGCA 


12240 


1S 


TATGTTCGTG 


CTTATCCAGC 


AGTAGGTAAA 


AATGTGCCTT 


TATACATTCT 


TGGTTCTTCA 


12300 


ACAGATTCTG 


CACATTTAGC 


TGCTCGCAAA 


GGG CTTCCAT 


ATGTGTTCGC 


TGGACATTTT 


12360 




GCACCTCAAC 


AAATGAAAGA AGCTATCGAA ATTTACAAAA CGTTATTTGA ACCTTCTGAT 


12420 


20 


GTATTAGACG 


AACCTTATGT 


TATTGTATGT 


TTAAATACAA 


TCGTTGCTGA 


AAATGATGAC 


12480 




GAAGCACAAT 


ATTTAGCTTC 


ATCTATGGCA 


CAAGTAATGG 


TTAGTATCAC 


TCGTGGCAGA 


12540 




ATGCAGCCCG 


TTCAACCGCC 


AACACATGAA 


CTACAAAATA 


TATTAACGCC 


GAGAGAATAC 


12600 


25 


GCGATGGCTA 


TGGAAAGACA 


GAAAATATCA 


TTAATAGGTT 


CAGAAAATAC 


TGTTCAACAA 


12660 




AAAATTCAAG 


ATTTTATGGA 


AACTTATGGT 


GAAGTCAACG 


AAATTATGGC 


AATAAGTTAT 


12720 




ATTTATGATA 


AAGATATGCA 


ATTAGACTCT 


TATCGTCGGT 


TCAAGAATGT 


TATAAATCAG 


12780 


30 


ATAAATGAAA 


AAAACACTTT 


ATAATGTGAT 


AAATAAACTA 


AGTGAAAGTA 


TGTATCCATA 


12840 




ATATTAATAA 


AAATATACAG 


TAACAGCATT 


TTGAATGAAA 


GATGTCTTTA 


TTGTTCAATC 


12900 




ATTTATTTTA 


GTAATGATTC 


AAATTCACTT 


AAAATyCTAA 


tGCAAATATG 


AAAGCGCCCC 


12960 


35 


TTCAcTTTAC 


ACTGTGTAAG 


TOTTTATTTG 


ATGGGGCGCT 


TTCAAAATAT 


TGAAAAGCAT 


13020 




ATCCfiAAATT 


TAAAGAAATT 


TATTTCTCTT 


TATCTTCATT 


TTcrrrrrrc 


TCTTCGTTAT 


13080 


40 


TCGATCCTGT ATATTCATTT ATCTTATCTT 


TTACATTTTT 


AACTTGTTCA 


TTATCGCTAT 


13140 


TTTTAAATTT 


TTCTACGCGT 


CTTTAGCTTT 


ATCCATAAAA 


CTCATATTAA 


TCGCTCCTCT 


13200 




TATATTTGAT 


TAGTTTAATT 


GAACTTATTT 


TTTAAGTTTA 


TCAATTGCAT 


CAGTTATTTT 


13260 


45 


GTTTTTAGCA 


TTTTCAACAA 


CTTCTTTTGC 


TTTaCCAGTC 


GCTTTATCTT 


GCTGACCTTC 


13320 




TTTTTCTAAT 


TCTTTGTTAT 


CAGTAACGTT 


ACCTACTGTT 


TCTTTAACAT 


TTCCTTTAAA 


13380 




TTGATCGAAC 


TtACTTTCGT 


CTG CCATAGT 


GAAACCTCCT 


TGGATGTATA 


TATTTATATA 


13440 


SO 


CCACTAAGGA 


GGTTCGCTmm mCAyymyAAT ATGAAGTTTT TATGTTATAG TATAGTATTT 


13500 




ATACGATTAA 


ATATAAAACA 


TGTATCCGTC 


TAAATCTTCA 


CTTGTATCTA 


CATATTCCGC 


13560 
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TAGTTGTTTT TGCGCAGGTG GTTCTGATTC AATACTTTCA ACAAATGTAA TTGGACCTTC 13680 
TAACAGTCTT ATAATATCCC CTGCTGAGAT TT CTT 13715 
5 (2) INFORMATION FOR SEQ ID NO: 196: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 873 base pairs 

(B) TYPE: nucleic acid 

70 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 196: 

AAATC CATAA TGTCATGATA ATCTGCATAT GCTTCATATA ATTCAATCAT TGTGAATTCA 60 

GGGTTATGTC TAGTTGATAC ACCTTCATTA CGGAATACTC TACCAATTTC ATATACTTTT 120 

20 TCAAGTCCAC CGACAATTAm ACGTTTTAAA TGCAACyCAA TAGCAATACG CATGTATAaC 180 

GTTGCATCTA ATGCATTATG ATGTGTTACA AATGGTCTAG CAGCTGCTCC ACCAGCAATT 240 

TGGTGCATCA TAGGTGTTTC TACTTCCAAG AAACCTTTAT TATTTAAATA ATTACGCATT 300 

25 TCTTGAATGA TTTTACTACG ATTAATAAAT GTACGAGTGC TATCTTCGTT CGTAATTAAA 360 

TCTAAATATC TTTGACGATA tCTCTGTTCA ATATCCTGTA AACCGTGGAA TTTATCCGGT 420 

AATGGTCGCA ATGATTTAGT TAGTAGCGTG AATTTCTTCG CTTTAACCGA TAATT CGCCA 480 

30 GTATTTGTTT TGAACATTAC ACCTTCAACA CCAACGATAT CGCCTAAATC AGCATTTTTC 540 

CATAAATCAA ATTCGTCATC GCCAACTTGA TCTTTACGAA CGTAAATTTG AATTTGT CCA 600 

GCTAAGTCCT GAACGTGTGC AAATC CTGCT TTACCTTTAC CACGCTTAGT CATTAATCGT 660 

CCAGCTATAG CGACATGACT ATCCGCTTCT TTTTCTACCA ATTCTTCTTT AGAATACTGG 720 

TCCeACTCTT CTTTCAAATC ACTAGATAAA CCTGAACGGT CAAATTTAGA ACCAAACGGG 780 

TCTATACCAA GATCATATAA TTCTTGTAAT TtTTGACGTC GAACCAACAT TTGGTCATTC 840 

ATTTCTTCTG ACATAACT t T CTCTCCTTTA ACT 873 
(2) INFORMATION FOR SEQ ID NO: 197: 



35 



40 



45 



50 



55 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 452 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 197: 
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ACCATAATAT 


GAATGGCTTC AGGATCAAAA TAAAGACCAA 


CTTCACTGCC 


TACTTCAGCT 


120 




TTTTTAGTCG 


TTTGTATTAC CCATTCATAA CCTTTATTGT 


CTATACAACA 


TATTTCATAG 


160 


5 


TGGACCCCTC 


TAAATAACAT AGAATCAACA GTTGCTTTAA 


ATAATCCTTC 


TTCAGCTTTG 


240 




ATTAATGATA 


TATCTTCTGG TCGAATAACG ACTTCTACTT 


TTTTATTTTC 


AGGAATACCC 


300 




ATATCGACAC 


ATTCGAAATC TTGCCCATAA ATATTCACGA 


CATAATCTCT 


AACCATGCGC 


360 


10 


CCTTCAACAA 
TaTATATCTG 


TATT AG ATT C TCCAATAAAA TCAGCTACAA 
TTGGTGTGCC AAATTGTTGA AT 


ATCGATTCAC 


TGGTTCGTCA 


420 
452 


75 

20 


(2) INFORMATION FOR SEQ ID NO: 198: 








(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2308 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 










(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 198: 






25 


TAGGTTGGGT 


TCTAACATAC GATAAAGCTC AACAAATCAA 


CACAGCTTTC 


TTTGTAAAAT 


60 




TGTTTAATAC 


TGCATTAGCA GAACGTGATT ATTATTTTAA 


TATAGATGGA 


ACAAATGCTT 


120 




TTAGATTATT 


TAATGCTGAA GGTGATGGTG TTGGGGGATT 


AACAATCGAC 


AATTACGATG 


180 


30 


GTCATTTGTT 


GATTCAATGG TACTCAAAAG GTATTTATAA 


ATTTAAATAT 


GCCATTCTTG 


240 




AAGCGGTTAG 


AAAAGTATTT GATTATAAAT CTATTTACGA 


AAAAGTAAGA 


TTTAAAGACA 


300 




GCGAATATAG 


TGGTGGTTTT GTTGAAGGAG ATGCACCTGa 


GTTTCCAATT 


GTTATCGAAG 


360 


35 


AAAACTTCAC 


ATTTTATAAT GTAGACCTTG AAGATGGTTT 


GATGACAGGT 


ATcrrrrrAG 


420 




ATCAAAAAGA 


AGTGCGCAAG AaATTAAGGG ATCAATATGC 


CAAAGAACGC 


CATGTTTTAA 


480 


*rv 


ACTTATTTAG 


TTATACAGGT GC1TTTTCTG CAAT AG CAGC 


AAGTGAGGCA 


TCTTCAACAA 


540 


CAAGTGT AGA 


TTTGGCTAAT CGTTCTCGTA GTTTAACTGA 


AGAAAATTTT 


GGATTAAATG 


600 




CTATTGATCC 


TAAATCCCAA TATATTTATG TCATGGACAC 


TTTTGATTTC 


TATAAATATG 


660 


45 


CTGCACGACA 


TGGACATAGT TATGACACGA TCGTGATTGA 


TCCACCTAGC 


TTTGCGCGTA 


720 




ACAAAAAACG 


TACATTTTCA GTGCAAAAAG ATTATGACAA ATTAATTAAT 


GGCGCCTTAA 


780 




ATATCTTATC 


ATCTGAAGGA ACATTATTGT TATGTACAAA 


CGCAAGTGTA 


TATCCATTAA 


840 


SO 


AGCAATTTAA 


AAATACTATT AAAAAGACGC TTGAAGAGAG 


TGGCGTTGAT 


TATGAATTAA 


900 




CTGAAGTTAT 


GGGATTACCA AAAGATTTTA AAACG CATCC 


ACATTATAAG 


CCATCTAAAT 


960 
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TATTGAGAAA AAGAAGGGTG ATAATATTAT GGGATTCAAA AACAATTTAA CATCAAATTT 1080 

AACAAATAAA ATCGGTAATT CAGTCTTTAA AATAGAAAAT GTTGACGGAA AAGGTGCAAT 1140 

5 GCCAACGACG ATTCAAGAAT TGAGAGAAAG ACGACAACGT GCTGAAGCAA TTGTAAAGAG 1200 

AAAGTCTTTA ATGTCATCAA CAATGAGCGT TGTTCCAATT CCGGGTTTAG ATTTTGGTGT 1260 

TGATTTAAAA TTAATGAAAG ATATTATCGA AGATGTTAAT AAAATTTATG GTTTAGATCA 1320 

10 

TAAGCAAGTT AATAGCCTTG GGGATGATGT GAAAGAAAGA ATTATGTCTG CAGCAGCAAT 13 80 

TCAAGGTAGT CAATTTATTG GTAAAAGAAT TTCAAATGCA TTTTTAAAAA TTGTAATTAG 144 0 

AGATGTAGCT AAACGTACTG CTGCAAAACa AACAAAATGG TTTCCTGTTG TAGGACAAGC 1500 

15 

TGTGTCTGCA TCTATTAGTT ACTATTTTAT GAATAAAATT GGAAAAGATC ACATTCAAAA 1560 

ATGCGAAAAT GTTATTAAAA ATGTCATGTA GGTGCTATAA TAGTTTTGCA ATTTGCAAAT 1620 

2Q TTTACTGAAA CCGGTTTTAA ACGAATTGAA TTTAAAGcAT GGTTTTGGTA AAGTTAATGT 16 80 

ATAAAACTAA GTTAGyATTG TAATAATATk GAAGATTCTA ACTATACGAA GGAGAAATGT 174 0 

AATTATGGAA CAAAATTCAT ATGTAATCAT CGACGAGAmT GGTATTCACG CTAGACCAGC 1800 

25 AACAATGTTA GTACAAACAG CTTCAAAATT CGATTCTGAT ATTCAATTAG AATATAACGG 1860 

TAAGAAAGTA AACTTAAAAT CAATCATGGG TGTTATGAGC CTTGGTGTTG GTAAAGATGC 1920 

TGAAATTACA ATTTATGCTG ACGGTAGTGA TGAATCTGAC GCCATTCAAG CAATCAGTGA 1980 

30 CGTCTTAT CA AAAGAAGGAT TGACTAAATA ATCATGTCTA AATTAATTAA AGGTATTGCC 2040 

GCATCTGATG GTGTCGCAAT TGCTAAAGCT TATTTATTAG TTGAGCCAGA CTTAACATTC 2100 

GACAAAAATG AAAAAGTCAC TGATGTTGAA GGAGAAGTTG CAAAGTTCAA TAGCGCTATC 2160 

35 

GAAGCTTCTA AAGTTGAGTT AACTAAAATT AGAAATAATG CAGAGGTTCA ACTAGGTGCT 2220 

GATAAAGCTG CTATCTTTGA TGCAcaTTGG GGGGTGGTAG ATG AC CCTGA ATTAATTCAA 2280 

CCAATCCAAG ATAAGATTAA AAATGAAA 2308 

40 

(2) INFORMATION FOR SEQ ID NO: 199: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5559 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

SO (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 199: 

AAGTAATAAA TCGTCTCATT TGGCAACTGA CG CAT AATTT CTTTAGCTAC TGTCAAACCT 60 

55 
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TTTAATTTTT AGTTT AT CAT AACTAAGCAT TGGATTTTAG TATTATGCAC TGTGTTTACC 180 

ATTTTTGTCA TTATAATATT TATTTTAAAT CAGCCCACTA TCATATTGTC ATGTAATCTG 240 

5 CTTATTAAAA AAATCCCTTC CAAGTTATTG TGTATCTCCA TTCAATTTAA TTTTGAAAGG 300 

AACATAACwT TTTAACTCAA AAGGGATTAA TTTnTAnTCT ACTTCATGGT CTGAACCAAA 360 

GAATGATTTA AACATGTGGA ATGTTGTTTC TCTGTTCATT GCTGCAATGG ATGTTGTTAA 4 20 

10 TGGAATACCT TTAGGGCAAG CATTAACACA GTTTTGTGAA TTAC CACACT GCTGTAAGCC 4 80 

ACCAGTACCC ATTAATGCAT TTAAACGTTC ATCTTTAGTC ATAGATCCTG TTGGGTGCAA 540 

ATTAAACAAA CGAACTTGCG AGATTGCTTG TGCACCAACG AaTTTATTAT TTTCAGTAAC 600 

15 

ATTAGGACAA ACCTCTAAAC ATACACCACA TGTCATACAT TTAGATAATT CATAAGCTGT 660 

TTGACGTTTT TTCTCTGGCA TACGTGGTCC CGGACCTAAA TCATACGTTC CATCAATTGG 720 

GATCCATGCT TTCATACGTT TTAAGTTATC GAACATTCTA GAACGATCAA CTTGTAAGTC 730 

20 

ACGGATAACT GGGAAAGTAT TCATTGGCTC TAAACGAATA GGTTGTTCTA ATTGATCAAC 840 

AATCGCAGAA CAAGATTGTC TTGCACGACC ATTGATAACC ATAGAACATG CTCCACATAC 900 

25 TTCTTCTAAG CAGTTCATAT CCCAGACAAC AGGTGTTGTT TTTTCACCTT TAATATTAAC 960 

TGGGTTACGT CTAATTTCCA TTAAACAAGC AATGACGTTT AAATTTTCAC GATATGGAAT 1020 

TTCAAATGTT TCTTCATAAG GCTTAGAATC ACTTGTATCT TGTCGTTTAA TAATTAATTT 1080 

30 TACTGTTTTT TGTTTCGGTT TAGATTGTGT TTCATGTTGT GGAGTGTTTT TCACTGATTG 114 0 

TTCAGTCATT ATTTTTTACC CCCTTTAGAC TTACTTGTGT AATCACGTTT ACGAGGTGGT 1200 

ATTAAACTCA CATCGACGTC AT CAT AAGT A AACTGCGGTT TTTCAAATGC GCCTTGGAAT 1260 

35 GAGGCCATTG TCGTTTTTAA CCACTCTTCA TCATTACGCT CTGGGAATTC TGGTTTATAA 1320 

TGGGCACCGC GTGATTCGTT ACGGTTATAT GCACCAATCG TAATAACACG TGCAAGTACT 1380 

AACAT G TTCC ATAGTTGACG GGTAAAGAAT ACCGCTTGGT TACTCCAAGT TTGAGTATCT 1440 

40 

TCCATATCAA TATCTTCATA ACGTTTCATC AATTCAACAA TCTTTTTATC TGTTTCTAAC 1500 

AGTTTTTCAT TTTCACGAAC AACAGTTACA TTTGCTGTCA TAATTTCACC AAGTTCACGG 1560 

TGTAATTTAT ATGCATTTTC TGTACCGCGC ATAGCTAATA ATTTATCAAA ACGTTCTTGC 1620 

45 

TCTTCAGCTT TACGCTTTTC AAAAATACTT TCGTCCATAT CAGTATATGA TCGATCAATA 1680 

TTTGAAATAT AATCAATCGC GTTTGGACCT GCTACTGTAC CACCATAAAT CGCTGATAAC 174 0 

50 AATGAATTGG CACCTAAGCG GTTACCACCA TGTTGAGAGA AGTCACATTC TCCAGCTGCA 1800 

AATAACCCTT TAATATTTGT CATTTGATCA TAATCTACAT ATAGACCACC CATTGAATAG 1860 

55 
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TAAATCTCAA TGATACCACC TAGTTTTACA 
TCAAGATATA CCATGTTTTC GCCATTTATA 

5 ATTTCACGCG TTGCGATATC ACGAGGTACT 

AAGAAGTACC AAGGCTTACC ATCTTTATAT 
GATTCACTCA TTAGTCGCAG TTTATCATCA 

10 AACTCACCAT TAG CAT AAAT AGCGCCTTGT 

TTAATCATTG AGTTTGTTGT TTTACCGAAA 
ACTGCATCTG AACCAAATGT TTCAATCTCA 

15 

CTTGCACTAT CATCGTCACC TTTAACTATG 
ACTAATCCAT CT ACTT CAT A TGCACGAACT 
CCAGTTGTTG CCCCTGCATA TGCTGTTCTG 

20 

TCTAATAGAC CTTCATTTGT TCTATTGAAC 
ATTTTAGGTG CTGCCTCTGT CATCGCTTTA 

2S CCATACACTG TATCATCAAA GTGAATCCAA 

GCACCATTAA TGCCACCTTG GGCACAAACA 
AACAAATCTA CATGTGCACC TTTTTCTGCC 

30 CCACCTCCGA CAACAATAAG ATGTTTCTCT 

AATCTATATT TGTTAAATGC GATGTATTAC 
TACGAAATAA CTAAAAATAC GATTAATGAA 

35 GATTGAAGTC CACCCCAAGT AACTAAGAAT 

ACAGCAATAA TACAAATAAT ATAAAATATT 
ATTAAATCGT AATTCACTTC TTTGCCGTAA 

40 

TGGATACCAA TAAAGATAAA TGTTAAGATA 
TTTCTAAAAA TCGAGTAATG TCCAACATTT 
AACAAACCGT GATATAACAA CGGAATGTAT 

45 

GGTAATGATT CCATAAAGTT AGATGCCTTA 
TGATTCACTA ATAAATGAAC GACCAAAAAT 
SQ TGAATACGTC TTAGATAAAA TTCATTTTTT 

CGAATATTTA ATTTATTGAG CTATTTATAT 

55 
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TCTAACTCAT 


GTGGATCTTT 


ATGTGACAAA 


1980 


CCTAATTTTT 


GGTTAATAGA 


TACATCGAAA 


2040 


AAGTTAC CAT 


AATCAGGATA 


TTTCTCTTCT 


2100 


GTCCAAATTC 


GTCCACCTTC 


ACCACGTGCT 


2160 


CCAGGGATTG 


CAGTAGGATG 


AATTTGAATG 


2220 


TGGTAAACAA 


TGGAAG CCGC 


TGATCCTGTA 


2280 


ATAATACCAG 


GGCCACCCGT 


TGCCATAATA 


2340 


GCAGTTGTCA 


TATTTTGTGC 


AnCGATACCT 


2400 


CCAAGGAATT 


CCCATCCTTC 


ATACTTCGTA 


2460 


TGTTCATCCA 


ATGCATATAA 


TAATTGTTGT 


2520 


TGATGTAATG 


TACCACCGAA 


ACGTCTAAAA 


2580 


ATTACGCCCA 


TACGGTCTAA 


TAAATGAATA 


2640 


ACAGGTGGTT 


GGTTTGCAAG 


GAAATCGCCA 


2700 


GGAGAATCGC 


CTTCCCCrtT AGTATTGACC 


2760 


GAGTGCGAAC 


GCTTTACTGG 


TACAACTGAG 


2820 


GCTTTAATTG 


TTGACATTAA 


GCCCGCTAGG 


2880 


GCCATAAAAA 


TTTCACTCCC 


CTAAATTTTC 


2940 


ATAAAGGCAA 


TAATTGCAGT 


AACACCAATA 


3000 


ACCCATGTAA 


ATACTCGTTG 


TGATTTTGGA 


3060 


GAC CATAAGC 


CATTTGCAAA 


GTGGAACACA 


3120 


GCCCATCCAG 


GATGTTGCAA 


TGTTTCGTGC 


3180 


AATGCTTTTT 


GTAAAOGTGT 


TTGCCATAAA 


3240 


CCACTCACTC 


TTTGGAAGAA 


GAACATCCAG 


3300 


TCTTTTGCTG 


TAAATGCAAT 


GTGTATACCA 


3360 


ATAAATAAAA 


ATTCTACAAT 


AATTAGAAAT 


3420 


TTAAACGCTT 


CAGCACCTTO 


TGTTGCTTGG 


3480 


GCACCTATTG 


GGATAATACC 


TAATAACGAG 


3540 


GATTGAGCCA 


AAAGGAGTCC 


CCCCTGTGAA 


3600 


TAAACGTACG 


CTTAACCCCC 


TAAAGTGATA 


3660 
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CGATCAC CAA ACTGCATGTC GAACAATGTA ACATTTGGAT TCGATATTTA AAATTGCTTG 3780 

TGATGATAAA CTTTCTCATT TAGAAAACGC TTCCACGTAC ATTCAAAAAA ATAACTTTGT 3840 

TAACCATATT GTAACATTAT TTCATATATT TTGGGGCATG AGAATGATTC TCACGCCCAG 3 900 

TAATTTATTT ATGCAATTGT TCATGTAGGT TCTTTGCGAC GTTTTCAGGA ATACCTATAT 3 960 

TTTTAAAATC TTCAAGTGTA GCTTCCTTCA TTTTCTTGAT TGAACCGAAT GAACGCAATA 4 020 

ATAATGTTTT ACGTTTGTTA CCGATAC CAT CTATATCATC AAGTATTGAT TTCAAGCCTG 4 080 

TCTTTTGACG TGTTTGTCTA TGAAATGTGA TTGCGAATCT GTGAACCTCA TCTTGGATAC 414 0 

GGTGCAACAA ATAAAATGCC TGGCTATTTT TCTTCAGTGG TACAATTTCT GCACTAGCGC 4200 

CATATAATAA TTCAGATGTT TGGTGTTTAT CATTTTTCTG CAAACCTGCA ACAGGGATAT 4260 

CAAGACCTAA TTCGTTTTGT AGCACATCAA TAACCCCGTT CATATGTCCT TTACCACCAT 4320 

CTACTATTAT TAAATCAGGT AATGGTAATC CTTCGTTTAA AACGCGAGAA TATCGTCGTC 4380 

TTACTACTTC TCTCATTGAT TTGTAATCAT CTGGACCTTT AACCGTTTTG ATTTTATACT 4440 

TTCTATAATT TTTCTTATCT GGTTTACCGT CGACAAATGT AACCATTGCT GACACTGGAT 4 500 

2S CCACACCTTG AATATTAGAA TTATCGAATG CTTCAATTCT AATTGGTGTT TGAATTCCCA 4 560 

TTTGTGTTCC AAGTTCTTCA ATAGCTTTAA TCGTTCTGGA CTCATCACGT GATATTAATT 4620 

CAAATTTATT ATTTAAGGAT ACTTTAGCGT TATGTGCAGC TAGGTCAACC ATATCTTTTT 4 680 

30 TGGGACCTCG CGCGGGTTGA ACGATTTTAG TGTCCACAAC AGATTGAATC ATTTCTTTAT 4 74 0 

CCAAATTACG TGGTACATGA ACTTCCTTAG GTAAAATATG TTGGTTTAAG CTATAAAATT 4 800 

GTCCAATAAA TGTATAAAAT TCTTCTTcTT CTGTTTGCTG TAATGGAATC ATCGTTGTAT 4 860 

CTCGCTTTAT CAT ATT AC CT TGTCGTATAA AGAAAACTTG GATACACATC CATCCTTTAT 4 920 

CAAGACTATA ACCAAAGACA TCACGAATCG TTTTATCTGA TGACATAATT TTTTGTTTGT 4 980 

TTGTCAGATT TTGAATATGT TGAATTAAAT CTCTATATTC TTTAGCCCGT TCAAAATCAA 5040 

GTGATTCACT TGCAGTTAAC ATTCGCTCTT CTAAACTTTT TAAAATTGTT TTGTCTTCCC 5100 

CATTCAGAAA ATCAGTAATT TCCTTCGTCA TTTGTGCGTA TTTACTCAAA TCAACGTCAT 5160 

ATACACATGG TCCTAAACAT TGTCCAATAT GGTAATAAAG ACATAATTTA TCTGGCATCT 5220 

TATCACATTT GCGATATGGA TATATTCTGT CTAATAACTT TTTAGTTTCT TGAGCAGAAT 5280 

ATG CATTCGG ATACGGTCCG AAATATTTGC CAGTACCTTG TTTTACAGTT CTCGTCACTA 5340 

50 GTAGTCTAGG ATATTTCTCC TTCGTAATTT TAATAAATGG ATAACTTTTA TCATCCTTTA 54 00 

ATAATATATT ATATCTTGGT TGATATTGTT TAATCAGATT CAATTCCAGT AAAAGTGATT 5460 
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TTTTAGCATC ATGAGCACCC GTAAAATATG ATCGCAATC 5559 
(2) INFORMATION FOR SEQ ID NO: 200: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4594 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 200: 



75 


AAATCAATCG 


AGTGGCATGT 


CAAGGTCATA 


TCAATATTTT 


AGAATCTGCG 


ACTATGAGAG 


60 


AGGAAATAAA 


TGAAATTGCG 


CGACGTATCA 


TCGTTGATAT 


TCGTGATAAG 


CAATTACGAT 


120 




ATCAAGATAT 


TGCTATTTTA 


TATCGTGATG 


AATCTTATGC 


TTATTTATTT 


GATTCCATAT 


180 


20 


TACCGCTTTA 


TAATATTCCT 


TATAATATTG 


ATACAAAGCG 


TTCGATGACA 


CATCATCCGG 


240 




TCATGGAAAT 


GATTCGTTCA 


TTGATTGAAG 


TTATTCAATC 


TAATTGGCAA 


GTGAATCCAA 


300 




TGCTACGCTT 


ATTGAAGACT 


GATGTGTTAA 


CGGCATCATA 


TCTAAAAAGT 


GCAT ACTT AG 


360 


25 


TTGATTTACT 


TGAAAATTTT 


GTACTTGAAC 


GTGGTATATA 


CGGTAAACGT 


TGGTTAGATG 


420, 




ATGAGCTATT 


TAATGTCGAA 


CATTTTAGCA 


AAATGGGGCG 


TAAAGCGCAT 


AAACTGACCG 


480 




AAGATGAACG 


TAACACATTT 


GAACAAGTCG 


TTAAGTTAAA 


GAAAGATGTC 


ATTGATAAAA 


540 


30 


TTTTACATTT 


TGAAAAGCAA 


ATGTCACAAG 


CGGAAACTGT 


AAAAGATTTT 


GCAACTGCTT 


600 




TTTATGAAAG 


TATGGAATAT 


TTCGAACTGC 


CAAATCAATT 


GATGACAGAG 


CGAGATGAAC 


660- 


35 


TTGATTTAAA 


TGGTAATCAT 


GAAAAGGCGG 


AGGAAATTGA 


TCAAATATGG 


AATGGCTTAA 


720. 


TTCAAATCCT 


TGATGACTTA 


GTT CT AGT AT 


TTGGAGATGA 


ACCAATGTCG 


ATGGAACGTT 


780 




TCTTAGAAGT 


ATTTGATATT 


GGTTTAGAAC 


AATTAGAATT 


TGTTATGATT 


CCGCAAACAT 


840 


40 


TGGACCAAGT 


AAGTATTGGT 


ACGATGGATT 


TGGCTAAAGT 


CGATAATAAG 


CAACATGTTT 


900 


ACTTAGTAGG 


TATGAATGAT 


GGAACGATGC 


CACAACCAGT 


AmTGCGTCAA 


GCTTGATTAC 


960 




AGATGAAGAA AAGAAATACT 


TTGAACAGCA 


GGCTAATGTC 


GAGTTAAGTC 


CAACATCAGA 


1020 


45 


TATTTTACAG 


ATGGATGAAG 


CArrrrurrro 


TTATGTTGCT 


ATGACTAGAG 


CTAAGGGAGA 


1080 




TGTTACATTT 


TCTTACAGTC 


TAATGGGATC 


AAGTGGTGAT 


GATAAGGAGA 


TCAGC CCATT 


1140 




TTTAAATCAA ATTCAATCAT TGTTCAACCA ATTGGAAATT 


ACTAACATTC 


CTCAATACCA 


1200 


SO 


TGAAGTTAAC 


CCATTGTCAC 


TAATGCAACA 


TGCTAAGCAA 


ACCAAAATTA 


CATTATTTGA 


1260 




AGCATTGCGT 


GCTTGGTTAT 


ATGATGAAAT 


TGTGGCTGAT 


AGTTGGTTAG 


ATGCTTATCA 


1320 
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GTTTGACAAT GAAACTGTAA AATTAGGTGA AACGTTGTCT AAAGATTTAT ATGGTAAGGA 1440 

AATCAATGCC AGTGTATCCC GTTTTGAAGG TTATCAACAA TGCCCATTTA AACACTATGC isoo 

GTCACATGGT CTGAAACTAA ATGAGCGAAC GAAGTATGAA CTTCAAAACT TTGATTTAGG 1560 

TGATATTTTC CATTCTGTTT TAAAATATAT ATCTGAACGT ATTAATGGCG ATTTTAAACA 1620 

ATTAGACCTG AAAAAAATAA GACAATTAAC GAATGAAGCA TTGGAAGAAA TTTTACCTAA 1680 

AGTTCAGTTT AATTTATTAA ATTCTTCAGC TTACTATCGT TATTTATCAA GACGCATTGG 1740 

CGCTATTGTA GAAACAACAC TAAGCGCATT AAAATATCAA GGCACGTATT CAAAGTTTAT 1800 

GCCAAAACAT TTTGAGACAA GTTTTAGAAG GAAACCAAGA ACAAATGACG AATTAATTGC i860 

ACAAACATTA ACGACAACTC AAGGTATTCC AATTAATATT AGAGGGCAAA TTGACCGTAT 1920 

CGATACGTAT ACAAAGAATG ATACAAGTTT TGTTAATATC ATTGACTATA AATCCTCTGA 1980 

2Q AGGTAGTGCG ACACTTGATT TAACGAAAGT ATATTATGGT ATGCAAATGC AAATGATGAC 204 0 

ATACATGGAT ATCGTTTTAC AAAATAAACA ACGCCTTGGA TTAACAGATA TTGTGAAcCA 2100 

GGTGGaTTAT TATACTTCCA TGTACATGAA CCTAGAATTA XATTTAAATC ATGGTCTGAT 21S0 

25 ATTGATGAAG ATAAACTAGA ACAAGATTTA ATTAAAAAGT TTAAGTTGJ^G TGGTTTAGTT 2220 

AATGCAGACC AAACTGTTAT TGATGCATTG GATATTCGTT TAGAACCTAA ATTCACTTCA 2280 

GATATTGTAC CAGTTGGTTT GAATAAAGAT GGCTCTTTGA GTAAACGAGG CAGCCAAGTG 234 0 

30 GCAGATGAAG CAACGATTTA TAAATTCATC CAACATAACA AAGAGAATTT TATAGAAACA 2400 

GCTTCAAATA TTATGGATGG ACATACTGAA GTTGCACCAT TAAAGTACAA ACAAAAATTG 2460 

CCATGTGCTT TTTGTAGTTA TCAATCGGTA TGTCATGTAG ATGGCATGAT TGATAGTAAG 2S20 

CGATATCGAA CTGTAGATGA AACAATAAAT CCAATTGAAG CAATTCAAAA TATTAACATT 2580 

AATGATGAAT TTGGGGGTGA GCAATAGATG ACAATTCCAG AGAAACCACA AGGCGTGATT 2640 

TGGACTGACG CGCAATGGCA AAGTATTTAC GCAACTGGAC AAGATGTACT TGTTGCAGCC 2700 

GCGGCAGGTT CAGGTAAAAC AGCTGTACTA GTTGAGCGTA TTATCCAAAA GATTTTACGT 2760 

GATGGCATTG ATGTCGATCG ACTTTTAGTC GTAACGTTTA CAAACTTAAG CGCACGTGAA 2820 

ATGAAGCATC GTGTAGACCA ACGTATTCAA GAGGCATCGA TTGCTGATCC TGCAAATGCA 2 880 

CACTTGAAAA ACCAACGCAT CAAAATTCAT CAAGCACAAA TATCTACACT CCATAGTTTT 2 94 0 

TGCTTGAAAT TAATTCAACA GCATTATGAT GTATTAAATA TTGACCCGAA CTTTAGAACA 3000 

SO AGCAGTGAAG CTGAAAATAT TTTATTATTA GAACAAACGA TAGATGAGGT CATAGAACAA 3 060 

CATTACGATA TCCTTGATCC TGCTTTTATT GAATTAACAG AGCAATTGTC TTCAGATAGA 3120 
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AATCCTACAA ATTGGTTGGA TCAATTGGTG ACACCATACG AAGAAGAAGC ACAACAAGCG 

CAACTTATTC AACTACTAAC AGACTTATCT AAAGTATTTA TCACAGCTGC TTATGATGCT 

TTAAATAAGG CGTATGATTT GTTTAGTATG ATGGATAGCG TCGATAAACA TTTAGCTGTT 

ATAGAAGATG AACGACGTTT AATGGGGCGT GTTTTAGAAG GTGGCTTTAT TG AT AT AC CT 

TATTTAACTG GTCACGAATT TGGCGCGCGT TTGCCTAATG TAACAGCGAA AATTAAAGAA 

GCAAATGAAA TGATGGTCGA TGCCTTAGAA GATGCTAAAC TTCAGTATAA AAAATATAAA 

TCATTAATTG ATAAAGTGAA GAGTGATTAC TTTTCAAGAG AAGCTGATGA TTTGAAAGCT 

GATATGCAAC AATTGGCGCC ACGAGTAAAG TACCTTGCGC GTATTGTGAA AGATGTTATG 

TCAGAATTCA ATCGAAAAAA GCGTAGCAAA AATATTTTGG ATTTTTCTGA TTATGAACAT 

TTTGCATTAC AAATTTTAAC TAATGAGGAT GGTTCGCCTT CAGAAATTGC CGAATCATAC 

CGTCAACACT TCCAAGAAAT ATTGGTCGAT GAGTATCAAG ATACGAACCG AGTTCAAGAG 

AAAATACTAT CTTGCATCAA AACGGGTGAT GAACATAATG GTAATTTATT TATGGTTGGA 

GATGTTAAGC AATC CATTT A TAAATTTAGA CAAGCTGATC CAAGTTTATT TATTGAAAAG 

TATCAACGCT TTACTATAGA TGGAGATGGC ACTGGACGTC GAATTGATTT GTCGCAAAAC 

TTCCGTTCTC GAAAAGAAGT ACTGTCAACG ACTAACTATA TATTCAAACA TATGATGGAT 

GAACAAGTCG GTGAAGTAAA ATATGATGAA GCGGCACAGT TGTATTATGG TG CAC CAT AT 

GATGAATCGG ACCATCCaGT AAACTTAAAA GTCCTTGTTG AAGCGGATCA AGAACATAGT 

GATTTAACTG GTAGTGAACA AGAAGCGCAT TTTATAGTAG AACAAGTTAA AGATATCTTA 

GAACATCAAA AAGTTTATGA TATGAAAACA GGAAGCTATA GAAGTGCGAC ATACAAGGAT 

ATCGTTATTC TAGAACGCAG CTTTGGACAA GCTCGCAATT TACAACAAGC CTTTAAAAAT 

GAAGATATTC CATTCCATGT GAATAGTOGT GAAGGTTACT TTGAACAAAC AGAAGTCCGC 

TTAGTATTAT CATTTTTAAG AGCGATAGAT AATCCATTAC AAGATATTTA TTTAGTTGGG 

TTAATGCGCT CCGTTATATA TCAGTTCAAA GAAGACGAAT TAGCTCAAAT TAGAATATTG 

AGTCCAAATG ATGACTACTT CTATCAATCG ATTG 

(2) INFORMATION FOR SEQ ID NO: 201: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6313 base pairs 
(B> TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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GGTTTT CnTG 


GAAAGATAGT 


GAAAATfTPG 


X Vj inn lVJU 


X X X X ynbb Ivj 


TTGTTTGTAT 


60 




TTTaTAAAAT 


GGCTTACATA 


TATGAAGCGT 


TGATTAAGTA 

X VJ^V X X aau X 


TGGAATTGTT 

IwAAl lUl 1 


A ATTAATTYia 
AA 1 Inn X iVjA 


120 


5 


AC CT ATTT AG 


CTTTAAGAAG 


GCATAACAAG 


AivjrA^v^i xax 


TTTAMVIPTi T 
i x lAiut Inl 


aaI a! llUlA 


180 




TTATGCGAAG 


ATTAAGGTGA 


GTAGTAAATT 


GO AT AAAA A A 


nTAAPTATTf 
Vj X AAV7 Inl 1 L 


AAALAnAuLn 


240 


10 


AGTGTTGAAA 


CAGCACAACG 


AAAAAGAAAA 


R't^T'lV^R B'l w t M 1' 
A XXX Unn XXX 


APTAPTGA Al^ 
A\. X n^, X Vj AAVJ 


unnL 1 IbuLA 


300 


ACAAAGGCAA 


TPTAAr w FTTA 


TTPGGTATGT 

X X w\JVJ X f\ X U X 


AfiAAPAAATT 

AVJAAV^AAAX X 




LAbl lAAIUr 


360 




TACAATAAAA 


GTGGATGATG 


AT AG rGTTAA 


V* X X OA X x <wVJ X 


AAAVlVj V- w AUi 


1 lAAIAlvjAA 


420 


15 


A X X VJ\^\ X X X X 


GTTGAAGGAP 


AAAPGArAAf 


aaW 11X1 1AL 


flATATATfW* 
uta IaIaI v_VjVj 


CTGGACvjAAT 


480 




TCCACTAGAA 
x v— ^^v»» lAwnn 


fSTTAA & A f A T 




AWA 111 \- 1 A 


AU iVAJAVjAlVj 


uTGGCAAGCT 


540 




AAARATTTAT 


iniOnnJ, Inl 


ATf*A ACT! ATA A 


TTAAA1 A A*TY5 
luAAnnnn 1 VJ 


GGTTCTTATC 


AATATGAAAT 


600 


20 


x AAl_ x *\ innu 


fiAfiATAflfl/T! 


& A^P^5 A & A^Pf* 


A 1 1 VJA X V_AAw 


iuAAALAAAC 


ATTAGTAGAA 


660 




V7rw% X X NJ WAW 


CAAGTATTA A 

WUVJ1A1 1AA 


waaaijV_au*.j[a 


TTA/lPAflATn 
1 lnuUnU a l\j 


nuAl 1 V„l_ I VJA 


1 A I 1 AAAA I 1 


720 




CZ AA rtT*TY'*f , T A. 

UAAw X X W w X X% 


AAGtATAr'AAA 


A A ATnr; A ("2 AT 


1 a l\jl_ 1 aw 1 a 


A1A1 iuLuAl 


WjTA ctg act 


780 


25 


AAGATTGCAA 


AGCGTAATpr 


TPf^TfJAAATT 

X V.u> X Uaaa X X 


uv. X unnuLuA 


TTY2TTT3 A T A A 


1 1 ALjATACT 


84 0 




GaAAAAGCAC 


ATGTAAAACA 


AATTGArATT 
aax ivxAWAl x 


VJV— X VJVJ X *mAW 


WAX IWil 1 AA 


1 X X 1 i'ACTTA 


900 




GATAATCAGT 


ATTTAACAGC* 


A ATT ft 'l^H*^*/ "T* 


nA Anr*A bttti 

VlAAUUlAl XkJ 


AAAAALjVJ XV9A 


rCAAl i ITjGA 


960 


30 


CATGTAAATH 


AATr!AAAAfV2 


TPAAAATfiTA 
X 1.aaaaX VJln 


X X wv_ X X vjnu X 


nlul 1 ILnuL 


x AAL CCTACA 


1020 




GGAGATTTAC 


ATATTGGTCA 


TGCTAGAAAT 
x vjv» x AuAnn x 


f^l"*Artr** Af J* I'" TY • 
UU1UUAU 1 X w 


UlaAiU^ 111 


AyC lAACAi 1 


1 An rt 


35 


TTAACTGCAG 


CTGGCTATAA 


TGTAACACGT 

X \ J X AAw\V»VJ X 


GAATATTATA 

V7AA1A1 XAXA 


TT A ATf3 ATY^ r* 

X XAAXUlAXwL 


TWIT A ITP & A 
Iw 1 aax LAA 


^ T A ft 

114 0 


ATTACTAACT 


TAGCGCGTTC 


GATTGAAACA 
wnx iwwwwi 


fYJTTTVTTTYJ 

w VJ X X X V_ X X 1 w 


AAO\« XXX AV7VJ 


luALAA 1 nwl 


i t n n 




TATTCAATGC 


CAGAAGATGG 


CTATAATGGA 


AAAGATATTA 

AAAUA X f\ X X 


TTGAAATAGG 

X XV3AAAXAV9VJ 


T A A afiiTTTE 
IaaAuAI 11a 


i o c n 
l^o U 


40 


GCAGAGAAAC ACCCTGAAAT 


TAAAGATTAT 
x nnnvin x x x 


TCTGAAGAAG 

X V- X UAAUAAw 


WM-VJ XXX VXAA 


aVsaaI 1 lAun 


I ^ o a 


AAATTAGGCG 


TAGAATACGA 


AATGGCTAAA 

n£^x V^JV* x Ann 


TTGAAAAATG 


ATTTAGrAGA 

AX X 1AUUAUA 


GTTPA ATA fY* 
v> X 1 V_AA 1 a^.\v 


i *i q n 




CATTTTGKTA 


ATTGGTTTAG 


TGAAaCATrT 


TTATATGAAA 

X XAXAlvSAAA 


AAfVIACIAA AT 

AAUUnUAAAl 


XwX luAAul 1 


144 U 


45 


TTAGCAAAAA 


TGAAAGAATT 




TATCAArlTTC 


ATfy!prrrap 

A Xvjw^VjV. 1 AW 


ATGGTTACGT 


i e rt n 
ID 0 0 




ACAACTGATT 


TTAAAGACGA 


CAAAGACAGA 


GTATTAATTA 


AAAATGACGG 


TACATATACG 


1560 




TATTTCTTAC 


CAGATATTGC 


GTACCACTTC 


GATAAAGTAA 


AACGTGGTAA 


TGACATTTTA 


1620 


50 


ATCGATTTAT 


TTGGTGCTGA 


TCATCATGGT 


TATATTAATC 


GTTTGAAAGC 


ATCTCTTGAA 


1680 




ACGTTTGGTG 


TAGATAGTAA 


TCGTTTAGAA 


ATTCAAATCA 


TGCAAATGGT 


TCGTITAATG 


1740 
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ATTATGGACG AaGTTGGCGT TGACGCTGCA CGTTATTTCT TAACTATGCG TAgTCCTGAT 1860 

AGTCACTTTG ATTTTGATAT GGAATTAGCG AAAGAGCAAT CTCAAGACAA TCCAGTTTAC 1920 

5 TATGCTCAAT ATGCACATGC GCGTATTTGT TCAATTTTAA AACAAGCGAA AGAGCAAGGT 1980 

ATTGAAGTGA CTGCTGCGAA TGATTTTACA ACGATTACTA ATGAAAAAGC GATTGAATTG 2040 

TTGAAAAAAG TAG CTG ATTT CGAACCTACA ATTGAAAGTG CTGCTGAGCA TAGATCGGCA 2100 

10 

CATAGAATTA CTAATTATAT TCAAGATTTA GCTTCTCATT TC CAT AAATT CTATAATGCT 2160 

GAAAAAGTGT TAACAGATGA TATTGAAAAA ACAAAAGCAC ATGTTGCTAT GATTGAAGCG 2220 

GTCAGAATTA CATTGAAAAA TGCATTGGCA ATGGTCGGTG TAAGCGCACC TGAATCAATG 2280 

IS 

TAAGAACATT TATATACACT CCAACGTAGA GTTTCTCGAA AGATACTTTG TGTTGGAGTG 234 0 

TTTTTTTTAG GTATGTGACA TATTGGGGAA TGCTTAGTAT GTGAATAAGG TTAAGAGGAA 2400 

CACAGTTGGA TGCTCTGCAC AACTG CAT AA GAGAGCCTGA GACATAAATC AATGTTCTAT 24 60 

20 

GCTCTACAAA GTTATAATGG CAGTAGTTGA CTGAACGAAA ATTCGCTTGT AACAAGCTTT 252 0 

TTTCAATTCT AGTCAACCTT GCCGGCGGGG CCCCAACAAA GAGAAATTGG ATTCCCAATT 2580 

2S TCTACAGACA ATGCAAGTTG GGGTGGGACG ACGAAATAAA TTTTACGATA ATATCATTTC 2640 

TGTCCCACTC CCTCTAAAAT GGAGGGTGTA AATGTTAGGA ACTGATGAAT TATATAAAGT 2700 

TTTATATGAA CATCTCGGAC CACAATTTTG GTGGCCTGCT GATAATGACA TTGAAATGAT 2760 

30 GTTAGGTGCA ATTTTAGTTC AAAATACTAG ATGGCGAAAT GCAGAAATTG CATTGAATCA 2820 

GATTAAAGAA CATACGCATT TTAATCCAAA TCATATATTA GAACTACCTA TTGAAACGTT 2880 

ACAATCATTG ATACATTCAA GTGGCTTTTA TAAAAGTAAA TCACTGACGA TTAAAACATT 294 0 

55 ATTAACATGG TTAGCACGAC ATCATTTCAA TTATCAAGAG ATTAATGAGC GATATAAAGG 3000 

TGGATTAAGA AAAGAATTAT TATCTTTGAA AGGTATTGGA AGTGAAACAG CAGATGTCTT 3060 

ACTTGTTTAT ATATTCGGAC GTATTGAATT TATTCCAGAT AGCTATACAA GAAAAATATA 3120 

40 

TGATAAATTA GGATATGAAA ACACTAAAAA TTATGATCAA TTAAAAAAAG TAGTCaCATT 3180 

ACCAAATCAT TTTACAAATC AAGATGCTAA TGAATTTCAT GCTCTGTTAG ATGTATTTGG 3240 

TAAACATTAC TTTAGAGACA AAGATATAAA GAATTATGAT TTTTTAGAAC CTTACTTTAA 3300 

4S 

AAAGTAAACG CTGTGAAGTT AGATAGATGA GTTTATATGA AATATAAAAA ATAATTTACT 3360 

ATTTTCTTTT AGTATGTGGA CTTATATAAT AAATAGAAGC ATATAAAGAA AAAAACAGTT 34 20 

SO GTTTGTTTGT GCAGCAACTG CATAAGAGCC CCTAATCGCT AAAGCTCAAG GGGAGTAAAG 34 80 

GAATACAGTT GTTTGTGCAG CAACTGCATA AAAGCCTCTA ATCACTAAAG GTGAAGAGGA 3540 

55 
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AACGCAGTTG GATgCTACCG 


CACAACTGCA 


TAAATCCCTC 


TaATCg CTAA AGCGAAAAGT 


3660 




GGGATTAAAA AGGAGATGTG 


ATAGTGTGAA 


GAAATCGTTA 


ATTGCTTTTA 


TTTTGATTTT 


3720 


5 


TATGCTTGTC 


CTGAGTGGCT 


GTGGTATGAA AGATAATGAT AAACAAGGTA 


GCAATGATAA 


3 780 




TGGCTCGTCT 


AAATCGCCGT 


ACCATAGAAT 


TGTTTCGTTA 


ATGCCTAGTA 


ATACTGAAAT 


3 84 0 


10 


TTTATATGAA 


TTAGGATTAG 


GTAAATACAT 


AGTTGGTGTT 


TCAACGGTTG 


ATGATTATCC 


3 900 


AAAAGATGTG 


AAAAAGGGTA 


AGAAACAATT 


TGATGCTTTG 


AATCTAAATA 


AAGAGGAACT 


1 A/* n 

-5 96 0 




TTTAAAGGCA 


AAGCCAGATC 


TAATTCTTGC 


GCATGAGTCG 


CAAAAGGCAA 


CTGCTAATAA 


4 02 U 


IS 


AGTATTGTCA 


TCATTAGAGA 


AACAAGGCAT 


CAAAGTAGTG 


TATGTTAAAG 


ATGCACAATC 


Anon 




AATTGATGAA 


ACTTACAACA 


CATTTAAGCA 


AATTGGGAAA 


TTAACGCATC 


ATGATAAGCA 


4 14 0 




GG CTGAACAA 


CTTGTTGAGG 


AAACTAAAGA 


TAATATCGAT 


AAAGTCATAG 


ATTCAATTCC 


4 200 


20 


TGCTCATCAT 


AAAAAATCAA 


AAGTATTTAT 


TGAGGTTTCA 


TCAAAGCCTG 


AAATATATAC 


4260 




AGCAGGGAAG 


CATACATTTT 


TTAATGATAT 


GTTAGAAAAA 


TTAGAAGCCC 


AAAATGTGTA 


4320 




TAGTGACATT 


AATGGTTGGA 


ACCCTGTAAC 


GAAGGAAAGT 


ATTATTAAAA 


AGAACCCAGA 


4380 


25 


TATATTAATT 


TCGACGGAAG 


CTAAGACAAG 


ATCAGATTAT 


ATGGATATCA 


TCAAAAAAAG 


444 0 




AGGTGGATTC 


AATAAAATTA 


ATGCTGTCAA 


GAATACACGT 


ATTGAAGTTG 


TAAATGGTGA 


4 500 




TGAAGTATCA 


AGACCAGGTC 


CACGTATTGA 


TGAAGGATTA 


AAAGAATTAA 


GAGATGCAAT 


A C C f\ 
4 3D U 


30 


TTATAGAAAA 


TAAACCATTC 


TAATTATGCC 


CCTTATTGCT 


ACATGTAAAA 


AATACATGTT 


/icon 




TGAGATAAGG 


GGTTTTTaAA 


ATATATTTAG 


TGAATGATAG 


CAACGCGAGT 


ATGTGATTGC 


a can 




TATAATGAAT 


GTAATTATCG 


ATGAAcaaAA 


GAGAATGCTA 


TGACATTTAA 


TAAAGTATTA 


A "7 A ft 


35 


TTGAGCTGGa 


TAGTCmTATT GATTATAACA ACTAGCATAT ATCTATTTTG 


GCAGTTGGGC 


tOUU 




GATM'CAATG 


ATGTATTTAA 


CCAGTCTATT 


TTAATCAATG 


TTAGATTACC 


GAGATTATTA 


•* a o \j 


40 


GAAGGATTGT 


TGACAGGTAT 


GATATTAACT 


GTTGCAGGCC 


TTATATTTCA 


AACAGTTTTA 


"m 7 « U 


AATAATGCAT 


TGGCAGATAG 


CTTTACATTA 


GGATTGGCAA 


GCGGCGCTAC 


ATTTGGTTCA 


4 980 




GGATTAGCAT 


TATTTTTAGG 


TTTAACAACG 


TTATGGATTC 


CTGTATTTTC 


AATAACATTT 


w w 


45 


AGTTTGATAA 


CATTAATAAC 


TGTATTAGTC 


ATTACGTCGG 


TATTGAGCCA 








GTTAGAATCT 


TAATATTAAG 


TGGTTTAATG 


ATTGGTGOGT 


TATTCAATTC 


ACTTCTATAT 


5160 




TTTTTGATTT 


TATTAAAACC 


TCGCAAATTA 


AATACAATTG 


CCAATTATCT 


GTTTGGTGGT 


5220 


50 


TTTGGTGATG 


CAGAATACTC AAATGTATCT ATAATAGCAA TCACATTTAT 


CATTGCATTG 


5280 




TTTGGTATAT 


TTATCATTCT 


TAATCAACTA AAGTTATTGC 


AATTAGGAGA 


ACTAAAAAGT 


5340 



55 
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ATAACGGCGA TAAATGTCGC ATATGTTGGC ATCATTGGAT TCATTGGTAT GGTGATACCG ~ 54 60 

CAACTCATTA GAAAATGGCA GTGGAAACAA TCATTAGGAA GACAATTGGC TTTAAATATT 5520 

GTAACTGGAG GACAAATAAT GGTTATGGCA GATTTTATTG GTAGCCATAT ATTGTCACCA 5580 

GTACAAATAC CGGCAAGTAT TATCATTGCA TTAATTGGTA TACCAGTGTT AtTTTACaTG 564 0 

CkAAwAtCtC aGTCgAAAcG GTTACaCTAG CACACGACaT TTGCTAAAAT AAAAATAACT 5700 

ATAAACATAA AGAGGGCATA AGCGATGGAT TTGAATCAAA TTAAAGCAGT TGTATTTGAT 5760 

TTAGAAGGTA CGTTGTTGGA CAGAGTTAAA T CTCG AG AG A AATTTATCGA AGAGCAATAT 5820 

GAACGATTTC ATGACTACTT AATTCATGTT CAACTGGCAG ATTTTAAAAA AgCATTTATT 5880 

GAGCTAGATG ACGATGAAGA TAATGATAAA CCTGATTTAT ATAAAGAAAT CATTAAACGT 5940 

TTCCATGTAG ATAGGTTAAC TTGGAAAGAC TTATTTAATG ATTTTGAAAT GCATTTTTAT 6000 

CGTTATGTAT TTCCTTATTA CGATACTTTG TATACACTAG AAAAgCTATC GCAAAAAGGC 6060 

TTTCAAATTG GTGTTATCGC AAATGGTAAA TCTAAGATTA AACAATTTCG ATTACATTCA 6120 

CTTGGTTTGA TGCATGTTAT TAATTATTTA TCAACATCAG AAACAGTTGG TTTTCGTAAA 6180 

CCACATCCTA AAATTTTTGA AGATATGATT GATCAACTAG GGGTATTACC TGAGCAAATT 6240 

ATGTATGTTG GCGATGATGC GTTAAATGAT GTAGCTCCAG CACGAGCTAT GGGCATGGTT 63 00 

AGTGTATGGT ATA 6313 

30 (2) INFORMATION FOR SEQ ID NO: 202: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2174 base pairs 
<B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
35 <D) TOPOLOGY : linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 202: 

CCGTAAACAC ATCAACAAAA GAAGGCTATA TTACAAAAGA AGACTTGGAC TTATGCTGCA 60 

CGTCGCTCTA ATTCAGCTGG AATGCAAGTC ACCGGACGAC TGGCTTACAT TGAACCTTAT 120 

GGGGCAACAA GTCGCACAAA ATAAACGCGC GAGAAGCaAG AATAGGAAGT GATATCTATG 180 

AAATGGTTAT CACGAATATT AACAGTAATA GTGACCATGT CtATGGcGTG TGGTGCATTG 240 

ATATTTAATC GTAGACATCA GCTAAAGGCG AAAACGCTGA ACTTCAATCA TAAAGCATTA 300 

ACAATTATTA TTCCGGCTAG AAACGAAGAA AAAAGAATAG GTCATTTACT ACATTCGATA 360 

ATACAACAGC AAGTTCCAGT AGATGTCATT GTTATGAATG ACGGATCGAC AGATGAAACA 420 
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ACGGATATAT 


TTTAGTAAGC 
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GCAATATGAA 
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GTTGATATTG 


CTGAAGTGTA 


CCAAAATGGT 


GTTAATAATC 


ATTATATTGA 


CTTATGGGAA 


1980 




TATTATGCAG 


CTATCGCAGA 


AAAAGATTTT 


CAAGATGTTA 


TGGATCAAAT 


CAAAGTATTT 


2040 




AGTATTGAAG 


CACAACCAAT 


CATAGAATTA 


GCAGCACGTA 


TATATATTGA 


AATACTGGAC 


2100 


50 


GAaGTGAGaC 
GCAAAGTTGT 


AGGCTAACTA 
TTCA 


TACATTACAT 


GAACGTGTTT 


TTGTGGaTAA 


GAGGAAAAAG 


2160 
2174 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4715 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 203: 

GAAnCAGnTA GACAAATTAT GGaAAmCGGT GTGAATCaAG GATTCtTTGG TGTAGCTGGT 60 

TTTGACCTAC TCGTCGATGA GGATGATAAC GTTTATG CGA TTGATTTAAA CTTTAGACAA 120 

AATGGTTCaA CGAGCATGTT ATTACTTGCT AACGAGTTGA ATTCAGGATA TCAAAAGTTT 180 

TATAGTTATC ATTCAAAAGG TGATAACACA CATTTCTTCA ATACGATTTT GAAATATGTC 240 

AAAGAAGGTA GTTTATACCC GTTATCTTAT TATGATGGTG ATTGGTACGG TGAAGATAAA 300 

GTTAAATCAA GGTTTGGCTG TATTTGGCAT GGTGATTCAA AAGAAACAGT ACTGGAGAAT 360 

GAACGCGCAT TTTTAGCTGA ACTTGAACAC TATTAGAGTT CGGAACATAA GGCGCTACAA 420 

TGTTGTGTTG CCAGTAGTTG ACTGAATATG CGTTTGTAAC AAGCTTTTTT CGATTCTAGT 480 

25 CAACAGTAAT TAAATTTATG ATATGGCAAT ACTTTGTAAT ACTAATAlfTA AATGGCGACT 54 0 

TTTATTTCAC TATGTTATAA GAGTTGCCAT TTTGTTGATA AAGGTATACT AAAGGTTATC 600 

GTTTTGAAAT TTTTAGTAAC TAGATATGTT TCGTGTTATA GACCGAATTT GTGTATACGT 660 

AAAATTTAAT GCTATTGAAT TTTTAAAATG AAAAACATGA CATTAAATTG AATTCATAAT 720 

ATGTCTAATT GACTAACTTG TTGGAGTCAT TTACTATTTT ATGTATGACA TATTTT A AAA 78 0 

AGTGAGGGTC AAGCATGTCT TATAAAGCAT ATCCATTCTT TAGAGATATA TTAATAAATG 840 

AATGTATTTA TTTCGCCTCT AAAAATAAAA AACTAGTACG CCTAAATTAT AAAAGTGAAG 900 

CGnAlGTAGG CGTTTGGACA GAAGAAAGTG TGGCCGTATC ATTTTTAACA AGTCGTGATA 960 

TTCCATTTGA TAAAGTTGTA AAAATGGACG TTGATCGTTT TGCTACTTAT GAATTAGATG 1020 

AATTGTTTGA TGAACAAGAC CATATTATTA TGAATCAAAC AATGGAAGAw GAAGGGCATC 1080 

TACTAAACGT TGTAGCTGTT ACACAAGAAG TGATGACGGA ATTAGATAAA ATTAGAATCA 1140 

AAGAATTTGT CCAAGATGTA GCGAAATATG ATGAAGTATA CGGCTTAACT AAAAAAGGTA 1200 

GTAAGCAGTT TATTCTCATT AGTGAAAATG ATAGCGACGA AAAAAAGCCG CATATTATGC 1260 

CTGTATGGAG TATTAAAAAC AGAGCGTTAA AAGTTCGAGA TGAAGATTTT GAAGAGTGTG 1320 

SO ATTTAATTAC GATTGAAGGT TCTGTTTTCG GAGAATGGCT AGATGAACTT AGAGATGATC 1380 

ATAAAGCCGT TGCGATAGAT TTAAAAACTG GCGTGGTTGG TACAATTGTT TCAGCGCAAA 144 0 
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35 


ATTTTGAAGT TGTATAGGAT TGTTAGTTAG 


TGACGCAATA 


TTAAAAGTAG 


TTCGTACGCA 
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GTGTATTTGT AAGTCTCTGA TTAAAATGAT 


AAGTAATGAG 


GAATAGTACA 


TTAATTTTGA 
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AATTTAaaaA ATATAAATAA gtaatttatt 


TAACTTAGAG 
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40 


AAATAATAGG TAAAATAATA TGGGGATTCA TGCTTCATAT ATAAAAAGAT AGGGGTTAAA 


2820 




TATATGGCTA aagaactttg ttttgaaggt 


ATCACTTTAA 


AAGCATTTGA 


TGAACAATAT 


2860 




CGTTCAGCAA TTAATGATTT TGACTTGAAT GAAAGACAAC 


AAATATATTC 


ATCTTTACCT 


2940 


45 


aaagaagtta ttgatgatgc AATTAATGAT 


GCTGATAGGA 


TTGCTAACGT 


AGCAwTAAmC 


3000 




GATAAAAATG AAGTGGTGGG CTTTTTTGTA 


TTACATCGTT ACTATCAGCA TGAAGGTTAT 


3060 




GATACACCTG AAAATGTCGT TTATATTCGT 


TCATTATCGA 


TTAATGAAAA 


ATATCAAGGT 


3120 


50 


TTTGGATATG GCACGAAAAT AATGATGTCA 


TTGCCGCAAT ATGTTCAAGG 


TGTATTTCCT 


3180 




GATTTTAATC ATCTATATCT AGTAGTAGAT 


GCGGAAAATG 


ACAATGCTTG 


GAACCTATAC 


3240 
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CTATATTACT TGGACTTAGA TTCAAAACAT GTTTCATCAT TAAAGCTTGA AGAAGAAAGT 3 360 

CGTTCAGAAG TGACCAATGT ACATATCATT AATTTAATGA TTGATGGCCA AAAGGTTGGC 34 20 

5 

TTTATCGCAT TGGAGCAGAT TGGTGAACGC ATGAACATTG CTGCTATTGA AGTGGATAAA 34 80 

TCATATCGCT TTAATGGTAT TGGTTCAAGT GCTCTGCGAC AATTGCCAAC TTACTTAAGA 3 540 

AAAAACTATG ACAACCTTAA TGTGATTACG ATGATTCTGT TTGGAGAGAA TAATGATTTT 3600 

10 

AAACCATTAT GTTTAAATAG TAATTTCGTT GAAATCGAAC AAACTGATGA TTATGTCGTT 366 0 

TTCGAAAAAT ATTTAAATTA CTAACAGTGA TTGCGAAATA TGATATTGTC ATTTATAATT 3 720 

J5 TAGTTTTGTT ACTATATATA AATGAATTCA GACGTATAAA TTTAGATTAT ATCCTTCGAA 37 80 

AGGAAGTATT GGGCAATGAA AATTCAAGAT TATACAAAAC AAATGGTTGA TGAAAAATCA 3840 

TTTATTGATA TGGCTTATAC ATTATTGAAT GATAAAGGCG AAACAATGAm mTTATATGAT 3 900 

20 ATyATCGATG AATTTAGAGC GTTAGGTGAT TATGAGTACG AAGAAATTGA AAATCGTGTT 3 960 

GTACAATTTT ACACGGATTT AAACACAGAT GGTCGTTTTT TAAATGTTGG AGAAAATTTA 4020 

TGGGGATTAC GTGATTGGTA TTCGGTAGAT GATATTGAAG AGAAAATCGC ACCAACTATT 4 080 

2S CAAAAATTCG ATATTCTGGA TGCAGATGAT GAAGAAGATC AAAACTTAAA ATTATTGGGC 4140 

GAAGATGAAA TGGATGACGA CGATGATATT CCAGCTCAAA CAGATGATCA AGAAGAACTA 4 200 

AATGATCCAG AAGATGAGCA GGTTGAAGAA GAAATCAATC ATTCGGATAT AGTCATTGAA 4 260 

30 

GAAGATGAAG ATGAACTAGA CGAAGACGAA GAAGTGTTTG AAGACGAAGA AGACTTCAAC 4 320 

GATTAATTTT TTGTTTGACT TTTAGTTGAA AGATGATAAA ATTTTATTCG GGCTCCTTTA 4 3 80 

AATAGGACAC GTGTATAAAA TTTATACGCT CCCCTTACAG AATTTGTGAG AGGGAGCGTT 44 4 0 

3S 

TTTTtATTTA ATTGAGTAAA TCAAGAAATG ATAACGCAAA AATCAAAGTT GTAAATGATA 4 500 

TACAJAGTGA CATAGCAGTA TGGAAACGGT AAGTAAACAG AATTTAATTT TGTCGAtTCG 4560 

ACAAtAAaCA aCTtGAaTGA GCTTGCTTTA ATGTTATGTn nTACGTAATT TTTACAATTG 4620 

40 

ATGAGGAAGC ATTCCCTTTA ATAATTAGGA GGTCAAGACA TGACAAAATT TATTTTTGTA 46 80 

ACAGGTGGCG TAGTTTCATC CATTAGGGGA AGGGT 4715 
4 5 (2) INFORMATION FOR SEQ ID NO: 204: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 918 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EONESS : double 
50 (D) TOPOLOGY: linear 
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ATAATAACTG AAATTAAAAT TGCTAAATmG TGTTaAgCTA TCGCmACAAT GAAAATwCCG 
ATTTTGCGTT GTTGAAAATA TCTTTCCAAA CCAAGAATCG ATAATGGCAA TAAATATAAT 
AAATTTCCAT AAAATGACCA AGTAAAATTA AAGTATATAA CGACAGTTGA CATGCCGTAT 
AAAATCGTAG CGATCATATT TGCTGAGCGT TTAAAGTGTA ATATTTTAAA TAAGTAGAAG 
GTCACGACAA ATGTTATGAT AGCTCGTATC ATAGCCATAA TAAGTTGGTT TGTCGGCCAA 
AAATGTATTG TCGTCGGATT AAATATACCA ACCGTTTCTC CTATTTTAAT GAAkAGAAAA 
TTTAGCCACA TTAAAGGTGA CAGCGAATAA TAATnTGATA GTCCTTTCAT ATAATCGCCA 
CCTAmTCCAA ACGATGCATC ATrTAAACTA GAAnAACTAC GTAGATGTTC ATACAnATAC 
ATTTGAAATG GCATCATTTG ACGGAATCCA TCTCCAGCCC CGCTAAAAAC AGTACCATTC 
ACAATATAAT CATAGATATG AGTAGAAAAT AAAATAAGCG TTAATATTAC ACTAATGAAA 
GTTATAACAA AGAATTGTTT GACGTTTGAA TTTAGCCACT TTTTTAACAC AACATTATCC 
TCAACTTTCA AATTTAAAAT TAAGTTTAAC TGAAACTAAA GTTAATGAGG TTCTTGATAG 
GTAAAGACGA AGATGACTGT GGAACAGATA CCTTATCATA GTTACTTAAA CTTTGGATCA 
TTTTCAGTTT ATCATTAAAC AAATATATTG AATAATAAAa aTGTCATACT GATAAAGATG 
AATGTCACTT AATAAGTAAC TTAGaTTTAA CAAATGATGA TTTTTAATTG TAGAAAACTT 
GAAATAATCA CkTATACC 

(2) INFORMATION FOR SEQ ID NO: 205: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 163 97 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 205: 



TCGCCCnATA 


ATCAATTTAT 


TTTTCATGTG 


CCACTCCTAT 


ACAAGCTnAC 


AATGCTTCTT 


CAGTTAAGGC 


AATATCTTTT 


AArmtrrrr 


GATATTTTTG 


TTCAAAGTCA 


TATTGTAACT 


GAACAATTTC 


TGGCAAACCA 


ATATGCCAAT 


CCGCCAATTT 


TTTTTTAyCT TtGAAGAGCT 


CTTTTGGTGA 


TGkTTG CGAC ACTATACTAC 


CTTCTTTCAT 


AACGATGACT 


TCATCTGCAT 


AACGCGCGAC 


TTCATTCATA 


TCATGTGAAA 


TTAGGATAAT 


TGCCTTATTT 


TCATCTGTTT 


GTAGTGACTT 


TAGTAATCTC 


ATTACTTGTC 


GTTTACTTTG 


TGGATCAAGT 


CCTGCTGTAG 


GTTCATCAAC 


CACGATAATA 


TCAGGATTCA 


TTG CCAATAT 


CGATACAATC 


GCTATTTTAC 
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AATCCATCAA 
TAGGTCCAAA 
GAAATACCAT 
TAATAGTAAT 
TTTGTATCAA 
GTTCAAATTC 
AGGTATAACT 
TAAGAATGAT 
ACCTATTCTT 
GACAGTCCCT 
CGTAATAGAA 
ATTTTGACGT 
GTTAAGTGCT 
AGGTTCATAA 
ATGCATTTCG 
AATTGAACCA 
CTTTTCAAAA 
TTTCTCTATG 
AATAGATGTC 
ATCACTTTGA 
TTGTCTCTCT 
TATATGACAT 
TTAAAGTGTT 
AAACGTTAAT 
ATACTTTCAC 
ATTCGCACTC 
TCCGATATTT 
TTAAATCTTT 
ATTAtCGTTG 



CAGACGATGG 
TATCATTTCA 
TCCAATTCTT 
GTCATCAACT 
CGTTGATTTA 
TGTATTAACA 
TACATTGTCA 
GTTTGGTGTC 
GTTAACTCTT 
TTATTCATAA 
ATGATTGTAA 
GCATCAGGAT 
AATACACTTG 
TCTGCACGTT 
TCATATGGAA 
ACAAATTGAT 
TTATCATCAG 
CCAATCATTA 
CACTGACCTT 
TATTGAAATG 
CCTTTACGAT 
TGACTGGGTT 
GTTTAACAAC 
AAAATAAATG 
TTCATTCAGT 
AAAAAAGTAA 
TATTCAATAA 
ATTTAGTTGA 
CACTCATTTG 



GCATAGTTTT 
CGCTCTACTG 
TTTCTTACAG 
GTAACTGTCC 
CCACTACCCG 
TCATGAATAG 
AACCGTATAG 
CCAGCATTTG 
CTGCATTGTC 
CGATAACATG 
TATTATGTTC 
CTAACATAGA 
CTATAGCCAC 
CTAACATATC 
CCGCATGATT 
TATCCGGATT 
TTATAGCTTG 
ACTTGGcAAT 
TAGGTATATT 
AAACATTTTT 
TCGTGTATCT 
CTCTATATAT 
TAATGATAAG 
ATTTACTAAT 
TCTAGTGAAA 
ATATAAAGAA 
AAAAGCGCGC 
TGGGGTACTC 
CTTTATATAA 



TGGCTTCATC 
TGTCCTCAAA 
GTCTAATATA 
CAGTAGTCGG 
TTTGTCCAAC 
CTTGATGCTG 
TCATAGTTGA 
ATTTATTTTG 
GAAAATTTCA 
ATCTGCTTCC 
TGATTTAACT 
AGTCGCCTCA 
ACGCTGCTTC 
AACTTGTTTA 
TTCGAGTCCA 
CTGAAATACA 
ATTATTATAA 
TGTAGATTTT 
AAAAGAAACA 
AAATACAATA 
ATCATATTTT 
TACTAGTATT 
GACTTTTATT 
ATAGGGGTGG 
TTGATCAAAC 
ATCGGACTTA 
ACCCCATCAT 
TGAGCTAGAC 
AAGTAGTTAG 



TAAATTCATT 
TAATTGAGAT 
TTTATCTTTG 
CTTTAACAGC 
GATGGCGTAA 
ATATGGTGTC 
TCCACCAGCC 
ATTGGGAATG 
GTCGCTGTGC 
ATCGCCTCAG 
TTTCTCACTA 
TCTAATATAA 
TGTCCCCCCG 
AGTGCTTCGC 
AATGCCACAT 
ATTCCTATGT 
AAAATTTCTC 
CCAGAACCGT 
TCTTTCAATG 
ACTGAATTCT 
ACAATATTTA 
TTCTGACTCA 
CCTCTCTAAC 
TCGCGTTTGA 
TAGCTTCATC 
AAAACATTTC 
AAGTTTGTTG 
AATATTTGTA 
TGTATTTATA 



TTAAAGTTTT 
TCGGGAAATT 
GTCTTATGTG 
GCATTAATAT 
TATTTAC CTT 
CCTTTTTGAT 
CTTCATAAGT 
GCAAATCTAG 
CTTCTTTATA 
ATAAATCATG 
AATCCAATAA 
TGACAGAGGG 
ATAATGCATT 
TGACTCTTCT 
CGTATTTTAC 
CTTTTCTTAA 
CAGATTTAAC 
TATGACCAAC 
TGAAGGATGC 
TATCCTCCAC 
TAAATCGCTG 
TTTCTAGTCT 
AATTATGTAT 
TTCAACGATA 
ATATTTTTAG 
TGTTCATAAG 
AGTTCACGCT 
TGTGGCAAAC 
TAAATTCTTA 



540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
I860 
1920 
1980 
2040 
2100 
2160 
2220 
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ACGAGTGTAA CCACCTTGAC 


GTTCTGTGTA 


AcGCTCTGCG 


ATTTCACCAA 


ATAATTTTTG 


2340 




AAGTGCAGTT 


' TGTGTAGTTT 


CATCTTCGTT 


TAAGATTTCA 


ACATTACGTA 


AAGTTTTAGC 


2400 


5 


TGCATTACGA 


. CGAGAAGCTA 


AATCTCCTTT 


TTTACCTAAA 


GTGATTAATT 


TCTCAACAAC 


2460 




ACTGCGAACT 


TCTTTTGCAC 




AGTTTCAATA 


CGTTCACTAA 


TAATAAGTGA 


2520 


10 


TGTAGCTAAG 


TCACGTAACA 


TAG CTTT ACG 


^^^^^^ ft M/^ » it m 

TTGATCAGAA 


GTACGACCTA 


ATTTTCTGTA 


2580 


ACCCATGAGT 


TAACCTCCTT 


TATCAATCTT 


CTTTTCTTAA 


TCCTAATCCT 


AAATCTTCTA 


2640 




ATTTGTATTT 


AACTTCTTCT 


AAAGATTTAC 


GACCTAAATT 


ACG CACTTTC 


ATCATGTCAG 


2700 


IS 


CTTCAGATTT 


GTCAGCTAAC 


TCTTGAACAG 


AATTGATTCC 


TGCGCGTTri' 


AAG CAGTTAT 


2760 




ATGAACGTAC 


AGATAAGTCT 


AATTCTTCAA 


TAGACATTTC 


taatactttt 


TCTTTTTGAT 


2820 




CTTCTTCTTT 


TTCAATCATG 


ATTTCAGCGT 


TTTGCGCTTC 


ATCAGTAAGA 


CCAACGAAGA 


2880 


20 


TATTCAAGTG 


TTCAGTCATT 


ATTTTTGCTG 


CTAATGAAAC 


TGATTCTTGT 


GGTGTGATTG 


2940. 




AACCATTAGT 


CCAAACATCC 


AATGTTAATT 


TATCAAAATC 


ACTGCTTTGA 


CCTACACGTG 


3000 




TATTTTCAAC 


AGTATAGTTC 


ACACGTTCAA 


CAGGTGAATA 


CAATGAATCA ACAGGGATTA 


3060 


2S 


CACCAATTGG 


TAAATCACTA 


GTATTATTTT 


GTTCTGCTAA 


TGCGTAACCT 


CTACCCTTGT 


3120 




TAGCAACTAG 


ACGAATTTTT 


AAGTG AC CAC 


CTTTAGATAC 


TGTTGCAATT 


TTAAGCTCTG 


3180 




GGTTTAAAAT 


TTCAACATCA 


CTATCATGTG 


TAATGTCGCT 


TGCTGTTACT 


TCGCCTTCAT 


3240 


30 


CACGTACATC 


AATTTCTAAA 


GTTTTATCTT 


CTTCAGAGTA 


AATTTTCAAT 


GCTAATTGTT 


3300 




TAATGTTCAT 


AATAATTGTA 


GAAACATCTT 


CAACTACATT 


GTCTACTGCT 


GAGAATTCAT 


3360 




GTAAAACTCC 


CTCAATTTCA 


ATATACTTAA 


CGGCTGCACC 


TGGTAATGAA 


GATAGTAGGA 


3420 


3S 


TACGACGTAA 


GGAGTTTCCT 


AO IvjTAGTAC 


CGTAG CCACG 


TTCTAGTGGT 


TCAACAACGA 


3480 




ACTTACCGAA 


TTTAGCATCT 


- TCACTAATTT 


CAATTGTCTC 


AATTCTAGGT 


TTTTCGATTT 


3540 


40 


CTATCATTTA 


AATATCCTCC 


1 lAlATACGT 


CGACTTAATT 


TAAAATGTTT 


GCTCAGTGAC 


3600 


CTGTAACAAT 


ACCATCATAA 


AX IAIACAvaj 


ACGACGTTTT 


GGTGGACGAC 


AACCGTTATG 


3660 




AGGTACTGGA 


GTAACGTCTC 


TvSATCGCAGT 


TACTTCTAAA 


CCTGCAGATT GTAATGCACG 


3720 


4S 






GAC CAGGTCC 


TTTAACTGTT 


ACTTCAACTG 


TTTTTAAACC 


3780 




ATGCTCCATA 


GCTGATTTAG 


ATGCAGTTTC 


AGAAGCCATT 


TGTGCTGCAA ATGGTGTTGA 


3840 




TTTTTTAGAT 


CClTiXiAATC 


CTAATGCACC 


AGCTGATGAC 


CATGATAAAG 


CATTACCGAA 


3900 


SO 


CTCATCAGTG 
TTCAATATTC 


ATAGTTACAA 


TAGTGTTGTT 


GAATGTTGAA 


CGGATGTGTG 


CTACACCATT 


3960 




TTTTTCACTC 


TACGTTTACG 


AGATACTTGT 


TTACGTGCCA 


TTTAAAATTT 


4020 
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CCAGGTCTAA 




TAT* TA/" /""P TV f*f' m T 


IXiTTTCTTAA 


GGTTATCAGC 


CAi'X'i'xTl CC 


5940 




GGATTAACTT 


GTACAAATOr* 


A T A n A AflT* AT 
A X Aunnu Inl 


ClT^f^ TV TV TV /"•fTV 

U X \a. AAT AGTA 


TAATTAGTAC 


«k av T4^V W IV TV 

AATATATACA 


6000 


5 


ACCATACCAA 


CATT ACTTn A 


ArtT! A TTTTJra 
nuunl X luwi 


«U\ ITCGCAA 


TGTTTTGTGC 


CCATTCTTTA 


6060 




T CTGGATAGA 


A PA A rfJTT A A 


r T V " T^ 1 f — I " TV f~lf*^f^ 

X\a 11L X AvjVjV* 


TV /"^»T* TV TV ^ TV TV /"* 7\ 

AuTAAGAAGA 


TV /^/^ /■»^"»TV 

ACGCCATTGC 


TV TV IV S** TV ll»H» 

AAAGATTACA 


6120 


10 


GGAATAAPAC 




V— A\_ XXXI AAA 


/VT TV /"* TV f*TV jv ^ 

GbTAGATAAG 


TTGCCTGTGA 


ACCTAATCTT 


6180 


-i- w>vkj^_- M.vj 111 


v* 1 X X v_ 1 X AvjC 


TV T* TV TTV*' TV TV T>0 

A 1 ATIajAA i L. 


GGAATTTTAC 


GAACGGCTTC 


AAGTACATAA 


6240 




a t & n c a r* it a 




TV *T*rf™» TV /"^ *TV^ TV ^ 


TV /' ■ fv TV IV 1% fT^^ - * 

ACTAAAAGTC 


CTAATAC x X X 


CAACCATGCT 


6300 


15 


nniUAIwrlAi 


CTTCTTGCCC 


AACGAACGCA 


tTTGTcCAAA 


TTGAATTAGA 


CTGGCTGGCA 


6360 






AATAC C CGCA 


AATATGATAA 


TAGAAATACC 


ATTACCAACA 


CCGAACTGAG 


6420 




1 VjA 111 LjA 1 v_ 


ALCAAGCCAT 


JV «TWT»7\ TV K k It 

A x X AAGAAAG 


GAGTTC CTGC 


TGTnCAAAAC 


TAGTGCTATT 


6480 


20 




luAIAAITGA 


CTGATTGATA 


ATCAGCGCAC 


Cx x x GAG AT A 


ATTATTAAAT 


6540 






1 ALCTATAGA 


nwM^l » JV 1V\ TA T* 

TTGGATAAAT 


GCTAAAGAAA 


TTGCTAAATA 


ACGAGTAACG 


6600 




1 1AX 1 XAAwl 


TTCTTCTACC 


TACTTCACCT 


TGTTTTGCCC 


ATTCTGAGAA 


TTTAGGGAGA 


6660 


25 


TA ' i ' TV r T*r^f^ 74 * t w i i * 


TV ""PA KTT*f 

uiAAlAAl L\j 


CATTACGATT 


GATGCAGTGA 


TGTAGGGTAC 


AATACCCATT 


6720 




c;r»ii ana &Tap 

UUiaAAAIAIj 


AAAA X Lvall 1 


CAAGGCTCCG 


CCACCAAAAG 


TATTTAATAA 


CTCAGTGGCA 


6780 


30 




1 iwwAi 1 


TA*TV"*TV TV TV IV **|» 

AX uAAAAGCTx 


GCAGGATTTA 


CTCCTGGAGC 


TGGTATATAA 


6840 


GTCCCTATTT 


TAAAAATTAC 


TAACATTGCT 


TV ^ MIW ** IV1 TV IV n 

AGTGTGAAGA 


AAATCTTGTT 


ACGAACCTCT 


6900 




TTTGTTCTAA 


AGAAGTTCAC 


AACjCjO 1 X 1\> A 


H r T*^* TV ■!»»?» TV TV m 

ATCATTAGAT 


CACCTCGTGT 


GcTCCACCTT 


6960 


35 


TAGCATCAAT 


AGCTTCTGCT 


GCTGAAG CTG 


AGAATTTATG 


AGCTTTCACT 


GTCAATTTCT 


7020 




TATCAAGTGA ACCATTACCT 


AGTATTTTGA 


MM*/V« I'I'W I'W 1* 

TACCAGAX X X 


TTCATTCTTA 


ACAACACCAG 


7080 




ATTCTACTAA 


TAAAGCTGGA 


GTTACTTCAG 


TACCATCTTC 


AAATTTATTA 


AGTTGGTCTA 


7140 


40 


AGTTAACAAT 


AGCATATTCT 


TTACGATTTA 


TGTTAGTAAA 


ACCACGTTTT 


GGTAAACGAC 


7200 




GGAATAATGG 


TAATTGACCA 


i-V- 1 lUAAATL 


CTGGTCTTAC 


ACCACCGCCT 


«V TV ^^^^ «v ^« ^WWT% 

GAACGAGCTT 


7260 




TTTGACCTTT 


GTGTCCGCGA 


CCACTTGTTT 


TACCGTTACC 


TGTCGCAACA 


CGACGTCCAA 


7320 


45 


CACGATTGCG 


TTCTTTACGT 


GAACCTTCTG 


CCGGTTTTAA 


CTCATGTAAT 


TTCATTTCGG 


7380 




CACCTCCTTG 


ATTATTTTTC 


TTCTACTGTT 


ACTAAGTGCT 


TAACTTTGTT 


GATTTGCCCA 


7440 


SO 


CGAATAGCAG 


GGTTATCTTC 


AACAACTACT GAACTGTTAG 


TCTTTTTAAG 


ACCTAAAGCT 


7500 


TCAACAGTTT 


TACGTTGTGT 


TTCAGGACGA 


CCAATAACAC 


TACGAGTGAG 


GGTAAmXiT 


7560 




AATTTAGCCA 


TAACTAGTTT 


TCCCTCCTTA ATTGTATAAT 


•rcrrcTAcra 


TTTTGCCACG 


7620 
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TCTTTTTTAT T AC CAGCT AG CTTTACGAAC GCCAGGGATT TGGCCTTTGT AAGCTAATTC 9540 

ACGGAAACAA ATACGGCATA ATTTAAATTT ACGATATACA GAATGTGGAC GGCCACAACG 9 600 

TTCACAACGA GTGTATTCAC GAACTGCATA TTTTTGTTTT TTTTGTTGCT TAG CAAC CAT 9660 

TGAAGTTTTA GCCACTTAAT TAGCCTCCTT TAAATAATTA TTTACGGAAT GGCATACCGA 97 2 0 

AGTTAGCTAA CAATTCACGA GCTTCTTCAT CAGTGTT AG C AGTCGTTACG ATAACAATAT 9780 

CCATTCCTCT AACTTTACTT ACTTTATCAT AGTCGATTTC TGGGAAAATT AATTGTTCTT 984 0 

TAACACCTAA AGTGTAGTTA CCGCGTCCGT CAAATGCTTT TTTAGAAACA CCTTGGAAGT 9 900 

CACGTACACG TGGTaATGAT ACTGAAATTA ATTTGTCTAA GAATTCATAC ATTCTTTCAC 9 960 

CGCGAAGTGT TACTTTCGCA CCGATTGGCA TACCTTCACG TAAACGGAAA GTCGCGATTG 10020 

aTTTTTTAGC TTTAGTTACT AATGGtTTTT GACCAGTGAT CAATTCTAAT TCTTCAACAG 10080 

20 CATTGTCTAA TACTTTAGAA TTTTGTACTG CGTCACCTAC ACCCATGTTC ACAACGATTT 10140 

TATCTATTTT TGGTACTTCC ATTACTGAAC TATAATTGAA TTTTTTCATT AAGTTTTCAG 10200 

TAACTTCAGT GTTaAACTTT TCtTTTaAAC GGTTCaAAGT GGGATCCTCC TTTCaACTTG 10260 

T t ATTAATTA TTAGAkTTAA TTTCTTCGCC AGATTTTTTA GCGATACGAA CTTTT' IT ACC 10320 

ATCAACAAAT TTGTAACCTA CACGAGTTGG TTCGTTTGTT TTAGGGTCCA ATAATTGTAC 10380 

ATTAGAAACA TGGATTGCTG CCTCTGTTTC TAAGATTCCA CCTTCAGGAT TTAATTGAGT 10440 

TGGTTTTTGG TGTTTTTTCA TAATGTTAAC ACCTTCCACA ACGACACGGT CTTTTTTAGG 10 500 

TAGAGTAGCA ATTACTTTAC CTTCTTTACC TTTGTCTTTA CCTGCGATAA CTTTAACGTT 10560 

GTCACCTTTT TTGATATGCA TGTGGGCACC TCCTTATTTG TATTGGTTGT TATTAATTAA 10620 

AGTACTTCTG GTGCTAATGA TACGATTTTC ATGAAGTTAC CTTCACGTAA TTCACGAGCA 10680 

ACAGGTCCGA AGATACGAGT ACCACGTGGG CCTTTGTCAT CACGGATGAT AACACATGCA 10740 

40 TTTTCATCAA ATTTGATGTA TGAACCGTCA TTACGACGAA CACCTGACTT AGTACGTACG 10800 

ATTACAGCTT TGACAACGTC ACCTTTTTTA ACAACGCCAC CTGGTGTTGC ATTTTTAACA 10860 

GTACATACGA TAACATCGCC GATGTTTGCT GTTTTACGAC CAGATCCACC TAATACTTTG 10920 

ATTGTAAGAA CTTCACGAGC ACCAGAGTTG TCTGCTACTT TCAAGCGTGT TTCTTGTTGG 10980 

ATCATTAGTT AAACCTCCCT TATCTCTAAA CTTGTATTAA ATAATTACTG ACT CTT CAAC 11040 

AATCTCTACT AAACGAAAAC GTTTTGTTGC TGATAAAGGA CGAGTTTCTT GAATTTTAAC 11100 

AATGTCTCCT AATTTAGCTG AATTGTTTTC AT CATGAGTT TTGTATTTTT TAGAGTATTT 11160 

TACTCGTTTA CCGTATAATT TGTGTGTTTT GTAAGTTTCA ACAAGTACTG TAATAGTCTT 11220 
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TTTTGTAACC TCCTCTTACT TAATTATTGA TT AGC CTTAC TTTGTTCAAT TTCTCTTTCA 1X340 

CGAGCAACAG TTTTTAGACG TGCAATCGTT TTTCTTACTG TACGAATACG TGCAGTTTCT 114 00 

TCTAATTGAC CTGTAGCTAA CTGAAAGCGT AGGTTAAAAA GCTCTTCTTT TGAAGATTTG 11460 

ATTTGTTCTT CGATTTCTGA AGTGGTTAAG TCTCTAATTT CCTTAGCTTT CATTTGTTTC 11520 

ACCACCCAAT TCCTCACGIT TTACAAACTT AGTTTTTACT GGAAGTTTGT GACTTGCTAA 11580 

ACGTAGTGcT TCACGCGCAA CTTCTTCAGA AACGCCAGCA ACTTCGAATA AAATTCTACC 11640 

TGGTTTAACA ACTGCGATCC AGCCTTCAAC CGCACCTTTA CCAGCACCCA TACGTACTTC 11700 

TAAAGGTTTT TTAGTATATG GTGTATGTGG GAAGATTTTA ATCCAAACTT TCCCGCCACG 11760 

TTTCATGTAA CGTGTCATTG CTATACGAGC AGATTCGATT TGACGAGATG TGATCCAAGA 11820 

CGTTGTTGTA GCTTGTAAAC CAAACTCACC AAATGTTACG TAtTACCGCC TTTAGAACGA 11880 

CCAGTTGTTT TAGGACGATG TTGACGACGA TATTTTACAC GTTTTGGTAG TAACATTATT 11940 

AT TT TCCTCC TCCACTAGTG TTCTTAGTAG GAAGAACTTC TCCACGATAA ATC CAT ACTT 12000 

TAACG CCTAA TTTACCGTAA GTAGTGTCAG CTTCAGCGTG tGCATAATCG ATGTCAGCAC 12060 

25 GTAACGTATG AAGTGGAACA GTTCCTTCTG AATATTGTTC AGCACGAGCG ATGTCAGCTC 12120 

CGCCTAAACG ACCAGATACT TGaGTTTTGA TACCTTTAGC ACCAAGTTTC ATAGCTCTAG 12180 

TGATTGCTTG TTTTTGTACA CGACGGAATG AAGCACGGTT TTCTAATTGA CGTGCGATGT 12240 



15 



20 



30 



35 



40 



TTTCAGCTAC TAAACGAGCG TCAAGATCAA CTTTTTTGAT TTCAATTACG TTGATGTGTA 12300 

/ 



CTTTTTTATC AGTTAACGCA TTTAATTTGT TGCGTAATTT TTCGATTTCT GAACCGCCTT 12 360 

TACCAATTAC CATACCAGGT TTACCAGTAT GAATTGCAAT GTTGATACGG TTTGCAGCAC 12420 

GTTCAATCTC TACGTGAGAA ACTGATGCTT CTTTTAATTC ATTATCAATA AATTTACGGA 12480 

TTTTTAAATC TTCGTGTAAA AGTGAAGCGA AGTCTTTTTC AGCATACCAT TTAGCTTCCC 12540 

AATCACGGAT AATACCAACA CGAAGTCCGA TTGGATTAAT TTTTTGACCC ACAGTATTCC 12600 

CTCCTTAAAA GTTAATTAAG CTTCTTTAGC TTCTTCTTTA CCGTCACTTA CGACGATTGT 12660 

AATGTGGCTT GTACGTTTGT TAATCGCACT TGCACGACCT TGCGCACGTG GACGGAAACG 12720 

45 TTTTAATGTT GGTCCTTCGT TAGCATATGC TTCTTTAACT ACTAATTCAT CTGTGTTCAT 12780 

GTCATAGTTA TGTTCAGCAT TAGCTAAAGC GGACATTAAT ACTTTTTCAA TTACTGGTGA 12840 

TGAAGCTTTG TTTGTTAATT TTAAAATTGC AATAGCTTCA GCAGCATTTT TACCTCTGAT 12900 

50 TAAGTCAAGA ACTAGTCTTA CTTTACGAGG TGCGATTCTT ATTGTTCTAG CAACCGCTTT 12960 

TGCTTCCATT AGGATGTCCT CCTCTACTTA ATAGATATTA TCTTCTTGTT TTCTTGTCGT 13020 
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TATCTTCAGT TACATATACA GGTACGTGTT TACGTCCGTC GTATACTGCA AAAGTATGTC 1314 0 

CGATGAAATT AGGGAAAATT GTAGAACGAC GTGACCATGT TTTGATTACT TGTTTCTTTT 13200 

5 CGCTTCCTTC TTGAGCTTCA ACTTTTTTCA TTAAATGCTC ATCGACGAAA GGTCCTTTTT 13260 

TAATACTACG AGCCATTTGG GCGCCTCCCT TCTTATTATG TGCGTGCAGC TTTAAGCCGC 13 320 

ACACCCAAAT AAGTTGATTA TATTATTTTT TCTTACGTCC ACGAACGATA AGTTTGTCTG 13380 

10 

ATGATTTTTT ACCACGACGA GTTTTCTTAC CAAGCGTAGG TTTACCCCAT GGTGACATTG 13440 

GAGATGGTCT ACCGATAGGA GCACGACCTT CACCACCACC GTGTGGGTGA TCGTTAGGGT 13500 

^ TCATTACAGA ACCACGAACT GTTGGACGGA TACCTTTCCA TCTTGAACGT CCGGCTTTAC 13560 

CAACGTTAAC TAATTCGTGT TGTAGGTTAC CAACTTGACC GATTGTAGCA CGGCAAGTAG 13620 

ATAAGATCAT ACGAACTTCA CCAGATCTTA ATCTGATTAA TACGTATTTA CCTTCTTTAC 13680 

20 CAAGTACTTG AGCACTTGCA CCAGCTGAAC GAGCGATTTG TCCACCTTTA CCAGGTTTAA 13740 

GCTCGATGTT GTGTACTACT GTACCAACTG GAATGTTTTG TAATGGTAAT GCGTTACCAA 13800 

CTTTGATGTC AGCTTCAGCA CCACTTTCAA CGATTTGACC TACTTCTAAT CCTTTAGGAG 13860 

25 CAATGATATA TCGTTTTTCA CCGTCTGCAT ATACAACTAA AGCGATGTTT GCTGAGCGGT 13920 

TTGGATCATA TTGAATAGAA TCAACTTTTG CATTGATACC ATCTTTGTTA CGTTTGAAAT 13980 

CGATAACACG GTATTGACGT TTGTGTCCAC CACCATGGTG TCTTACAGTC AATTTACCTT 14 04 0 

30 

GGTTGTTACG TCCCGCTTTT TTCGGTAGCG GTTTTAATAA TGACTTTTCA GGTGTAGTTT 14100 

TCGTGATTTC TGCGAAATCT AACGAaGTCA TATTACGACG ACCATTTGTT ATTGGCTTAT 14160 

ACTTTTTAAT AGCCATTGTC GCTTACCTCC TTAATGGTAA TTGTTTTATT AGTTAAATAA 14220 

3S 

GTCGATTGAT CCTTCTTTAA GAGTTACAAT CGCTTTTCTT CTTTTGTTTG TATAGCCTTG 14280 

GTAACGGCCC ATACGTTTTT TCTTAGGTTT GTAATTCATG ATATTAACAC TTGCAACTTT 14340 

TACGTTGAAG ATTTCTTCAA CTGCCATTTT TACTTGTGTT TTGTTAACAC GAGTATCAAC 14400 

40 

GTCGAAAGTG TATTTGTCTT CAGCCATTGC TTCAGAAGAT TTCTCAGTGA TTACGGGGCG 14460 

CTTAAGAATA TCTCTTGCTT CCATTATCCG AGCACCTCCT CAACTTTTTT AGCAGCAGCT 14520 

45 TCAGTAATTA CTAAGCTGTC AGCATTAGTG ATATCTAAAA CATTTAAACC TTGAGCAGTT 14580 

GTCACTTGAA CGCCAGGGAT GTTGCGTGCT GATAATTCAA CATTTACATC TTCGTTTTCA 14640 

GTAACTACTA ATACTTTTTT AGGTTGTTCT AATGTAGATA ATACATTTTT GAATTCTTTA 14700 

50 GTTTTTGGAG CTTCGAAGTT GAATGCGTCA ACTACAGTTA AGCCATTCTC TTGAGCTTTG 14760 

AAAGATAATG CTGAGCGTAA AGCTAAACGA CGCATTTTCT TAGGCATTTT GTATGCATAA 14 820 
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CCTTGACGAG CACGACCTGT TCCTTTTTGC TTCCATGGTT 
GCTGAACGAT TCTTAACAGC ATGCGTACCT TGACGTAATG 
GCTTCGAATA AAACGCTATT ATTTGGCTCA ATACCGAATA 
GAACCTGATT TAGTTCCGTC TAATTTTAAA ACATCATAAT 
CTTTCACTTC TTATTATTTA TTACCTTTTT TAATTGAAGT 
TTTTAGGTCC AGGTACGTTA CCTTTTACTA AGATAACTTT 
CTACTTCTAA GTTTTGAACA GTTACAGTGT TTCCACCCAT 
CTTTAAATAC TCTAGAAGCA TCTGAAGCCA TACCTACAGA 
GAGAACCGTG TGACATAGGT CCACGAGATT GTCCGTGGCG 
CTTTACCTTT TGATACGCCT GTTACGTCAA TAACGTCGCC 
AGACTTCTTG AaCCTAcTcG TAAGCATCCA CGTCTACATT 
GCTTAGGTGC TGCGTCAGCT TTTTTAGCGT GACCTTCAGC 
TAGATTTTGC ATCT T TTTT G TATG C TTTTT TGTCTTCAAA 
ATCCATCAAC TTCTACAGTT TTCTTTTGTA ATACAACATT 
TTACAGGGAT TAATTCACCG TTTTCTCCGA ATACTTGTGT 
AGATTCCTTT GGTCATCGAA AGTCCACCTC CTAAAATTGT 
TGTCTACACC AGATGGTAAG TTTAAGCCCA TTAAAGCGTC 
TTACAATATC GATTAAACGT TTGTGTGTAC GTTGTTCGAA 
ACTTATGCAC GGCACGGATG ATTGTGTAAA CTGATTTCTC 
CAGAAACATC TGCACCAGAA CGTTTCGCTG TTTCTACAAT 
TTACGCGGTG ATCATAAGCT TTTAATCTGA TTCTGATTTT 
CTCCTTATTC GTCTACATTT AGTGATAGAC TTCTCCACGA 
ATGGCAAAGC GGCCGGGTGT GTCAGTAACC TTTCGCTTCA 
CGTTAGTTAT ATTACACGAA AAACATCGAT AAATCAAGGC 
CTGTCTAACA CATACTTTTA TATTTnACTT TATATACTTA 
GATATTTTnA ATTTCCn 

(2) INFORMATION FOR SEQ ID NO: 206: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 29555 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 




14940 
15000 
15060 
15120 
15180 
15240 
15300 
15360 
15420 
15480 
15540 
15600 
15660 
15720 
1S780 
15840 
15900 
15960 
16020 
16080 
16140 
16200 
16260 
16320 
16380 
16397 
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w 



15 



25 



{xi> SEQUENCE DESCRIPTION: SEQ ID NO: 206: 

TnAGTTGTTT CTGCCACGAA AGATTCAATG GCTTTTCTTG CTTTACGCTT TTCTTTCAAT 60 

GGCAAATCAC CAATCATTTT TTTAAGGTGA TGTGGGTTTA CAACACCACT ATACTGGTAG 120 

TCATTTGAAn TTGTTTTTAG GGCTTGTTCA TCGATAGATC TCTCTCCAGC AAAT C C TTTG 180 

AACTCCGCTT CTTTTTTAAT ACTTTCGAAA TTAACATATT CTTGATCGAT ATCATCATCC 240 

TTATTTAAAG AAGGTACAAC ATTGT CGATG AATTCTCTAA TTAGATCTCG TTTTAACCTC 300 

AATGtCGGAT CATCTGCATG ATCTAAAATG CGTCTAATTT GTTCTTGGTT ACGACGTTGT 360 

TCCGCTTTGT CTTCAAGATC AATTTGTCTC AATATATTCA TAATATAATT CACATTAATC 420 

GTATCATTAC GCATCATTTC TATTTCGAAA TCAATATCAT TTAAAATGGA TACTTTATTT 48 0 

20 TTCTCAGCCG TCGCTCTTTT TACTTGATCG TACACAGCTA AATATTTACT TTTATAGTCT 54 0 

TCATTCTCTT GTTCATCCAT TCCAATTTCA TCAATTGTAA ACTCAAACTC GTCAAATGCT 600 

TTTAAACGTA ATATTATTTT AGCTAATAAA CGATAAGCtT CAACAAAGCG CTTTAGCTCT 660 

TCTTCATCtT GaATG t CATC AACCATGTGT GGTGTCGGCA CAATCATTTT AAGCTCACGA 720 

TAAGCGTCCA TAAATTCTTT TTTATACTCT TCATAACTGC GCATTAAAAT TGTATCCGTA 780 

TCATTTGTTT GTGAGAATAC TCTCAGTGCA TCGTCTGTCT CTTTTTTCAA GTCACGATAG 84 0 

TTTACAATTT TACCAAATGG CTTTGATTCT TTTTCAACCC TATTTGTACG TGAATACGCT 900 

TGAATTAAAT CATGATACAT TAAATTCTTA TCAACATATA AAGTGTTCAG TACTTTACTA 9S0 

TCAAAACCAG TTAAGAACAT ATTAACAACG ATTAAGATAT CAATTTTACT ATCTTTAACG 1020 

CCCTTTTTAA CGTTTTTtGA AATATGATTA AAATACTCAT TAGTTGtGGC TGnTGaAAAA 1080 

TTCGTCTCGA ACTTTTTATT ATAATCACTA ATCATTATCT CTAATTTTTC ACGTGAATGA 1140 

40 TATGGCACTT CACCATCACG ATCATCTTCA TTAGGTTTAA ACGTAAATAT ACCAGCTATC 1200 

GTTAACGGTT GTTCCAACTT TTTGTTAAGT CGCTTAAATG TCTCATAATA TTTAATAAGC 1260 

GCGTGAATAC TTTGGACTGT AAATATACTT GAATATTGAC GATTACGTGT ATATTTATCA 1320 

TGATTATTGA TGATATGTCG TGTTACTAAT TCCACACGTT TATCCGCTAA CCATACTTCT 1380 

TCCGTATCAA TTGCTTCAAC CATGCtGTTA TCTTCTGCTT TTAAAGCTTT ATTTTTAAAA 1440 

GTATTAATAT AGTCAACTGA GAAACCAAGT ACATTACCAT CATGAATGGC ATCTCTAATT 1500 

AAATACGTAT GTAAGCATCT ACCGAAAATA TCTGCAGTTG TTCTACCATC TTGACTACTA 1560 

TTTTCTGGAA AACGTGGCGT ACCAGTGAAT CCAAAGTATT GGGCATTTTT GAAATGTTGT 1620 
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ACTTTATTCG 
TTTTGAATCG 
GAGGTATTAA 
TGACTATCCA 
GATAAAATCT 
ACATATCCAT 
TGATACGGAC 
ATCATCTTAG 
ATACGGTTAT 
TTATTAGAAA 
AATAAGCCTG 
TCAATACCTC 
ACATCATAAC 
TTTTTACACC 
CTAAGTGGTA 
ATCGTTAACA 
TGACGCTCAT 
ACTCTTTCGT 
CTTTGGTATG 
ACTTTAATGA 
CTTATCTTTT 
CAAATCATTG 
CTATCAAATC 
CATGGCAGTC 
TATGTACTAC 
TTTCATTCAT 
AGCATTAAAA 
TGAACTTTGC 
TACAAACTTG 



TTTTATACTG 

TCGTTACAAT 

AAGTTTTGTC 

AGTCTTTACG 

GACTCGCTTT 

TATTCCCTGT 

GCATTGCCAT 

CTAATTGACA 

TCTGTTTATC 

AGTATCGCGT 

TGTAATTTTG 

GACGTTTCAA 

GTGCTTTATA 

AACTTTTCGT 

ATTTATCACG 

GACGTTGaAA 

TTAAAATCGT 

AACCCAATTG 

CCATTCATAT 

AAAATGTTTG 

AATATTTGTC 

ATAAATTTTT. 

ATTTTATTTT 

ACTGTAGGTA 

TACCTACTCT 

ATCACTAATT 

TTATTCTTCA 

TTTAATTTGT 

TAGCAACAAT 



TTCTAATAAA GGGGCATTCC 
AAGTGGCAAA CTTTTATCAT 
TACAGCACCC TTAGCAAATT 
GTCAACCAAA AAGATAACTT 
AAAAGAAGTC AACGTCTTAC 
CTCAGTCGCT TGTTGAATAA 
CAGTATTCTA TCTGTTTCAT 
AGGTCTCATA AATGACTCAG 
ACTCCAATAA AACATGTGAC 
TTCAACACCA TTACTAATGA 
TTTGCGGTAA CGTTTTACTT 
TTCAACTTGG ACAAGGGGTA 
TGTATCCTCG ACAGATACTT 
ATCTAAAAAC GACAAATAAA 
TAAAATACGG GCACTCTCGA 
TTCTTTATCT GTTAaGGGAT 
TCTAAAATTA TCAAGCAATT 
TTCAAGTTGA TTCATCATTT 
CCCCTTCCAT ACACTTTCTA 
TTTTTTATCT TCAAACGTAA 
TTTGAGGTAA GTCGTATACT 
TGTCTACGAT TAATGGAGGG 
TTATTATTAG TCTAAGTTAC 
ACTTCACTTC AATATTCGGC 
ATAAAAGTCC CGAATACAAT 
TGATAATAAT TGCTTTTAGC 
GCATTTAATT TCCATCTATG 
CACGCCTTTA TCATTTTCAA 
TTTTCATCAA GCAACTGAAT 



CTTGAATCGC TTTAGCCATT 1740 

TTAGTTGGCG TACCAGTTGC 1800 

TATTAAATTC CTCTTCTGTT 1860 

TCTTAATGTC ATCTTGCTGT 1920 

CACTTCCAGT TGTATGCCAT 1980 

GTGCTTCTAC CGCATACACT 204 0 

TAATAATCAT ATAGCGCGAT 2100 

CAAACGATTG CAATGTATTG 2160 

TCTTCAATAG TTCGCTATCA 2220 

TAAACATTTG TATGTAGCGG 2280 

GGTTAAACGC CTCATTAATA 2340 

GTCCGTTGAT TAATATCGTT 2400 

GATTCGTCAC TTGAAACTTA 2460 

TCTCAGACTC ATCATCACGT 2S20 

AAATACTTTT TCCATCAATC 2580 

TGCCTTCTAA TTTGTCCGCA 2 64 0 

GCTTATTATC ACGTATCGTT • 2700 

CATTTTCTAA TGCGTATTCA 2760 

TTGCTCTAAA TAT AT CAT AA 2820 

ATTTATTCTA ATTTTATTGT 2880 

AAAATTTGAA TACAAATAAT 2 940 

ACTTGAATGG TGTTAATTAC 3000 

TATTTAACTT TAAATCATTA 3060 

ATGTTCGCAG CCATACTCTT 3120 

CAACGCAAAC GATTTAAACA 3180 

ACCTTCGTAT TAGTTCATTT 3240 

AAAAAAGCAA AGCTCAAATC 3 300 

AATAGCCTCT ATGCCAGTTT 3 3 60 

CACATCAAAA ACTTCAATTG 3420 
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GTCGCAAGAT GCTTCCTGTA ATTATCAAGT GCCATTTTCG ATTGGGTTAT ACAATCTAGA 3 540 

ATCGCATGAT AATTTAATGC TACAAATCGA TAGTACAATA TATCTACCGT GAATAACTGT 3600 

GCAAATAGTG ACGTTGTAGC CGCCATACGC ATTTCATTTT CATCAGTTCT GCCATAAATC 3 660 

AATGCATAGT CTGCAATTTG AGCCACTGGA TTATTAGCTG TACTAGATAT AGTTATGATG 3 720 

GGAATACTGT AATGTGTGGC CACCTGTGCA ATTGACTGCA ATTCACTATG ACT AC CTTGA 3 78 0 

TTCGTCACAA AAATCATGCA ATCTCTATCA TCATGCGTCG CAAATGTTGA CACAAGTAAA 3 84 0 

TGCGTTTCAT GTAATAACCT GACATTTAAG CCAATACGAG ATAACTTTTG AAAAAGATCA 3 900 

CCAATAGTCA AACTCGATGC GCCAAATCCA AATAAAAATA TTGTCCTGGc ATTTTTCAAC 3 960 

ACATCACAAA TTGCATCAAT TTGCGCATCC ATAATATTAG TAGCTACAAA TCGCATCGTA 4020 

TTCGTTGCTC TAGCAATCAT TTTATTTTTC AAAGTTTCTA CAGATTCATT TTCAATCAAT 4080 

20 TCTAAATGTG GATTGGTTGC AATATCTTCG GGTAAGTATC GAGATATCGC AATCTTTAGC 414 0 

TCTTGAAAAC CTTGATGTGT CATTTTCCGA CTAAATCTAA CAATTGATGC TGTACTAACA 4200 

TTCGTAACAT CTGCCAAATC ATTCACAGTC AT AT CAATGA TTTTATGTGG ATTCTTTAAA 4260 

ATGTAATCAG CGATTATCTT TTCTGTCTTC GTAAAATCAC TCAACTGCTT ATCAATGCGA 4320 

TATAAAATAT TTGTCATCAT TAATCACCCA ACAAATCTGT CTGTCGCATC GCCTTTGTCG 4 380 

TTCCAAATAA ATATGTACAA ACGAATCCAC CAG CATACGC AGCAAGTAAT CCTGCAATAT 4440 

AACCTAAATA CATATTATCT GAGATTAATG GTAATAGTGA CACACCACTT GGGC CTATTG 4 500 

CTTTGGCACC AATATGTCCA ATTCCACCTA TTACAGCGCC ACCAATACCA CCACCAATAC 4 560 

AAGCAGTTAA GAAAGGTCGA CCTAATGGCA AAGTCACACC ATAGATTAAT GGTTCTCCGA 4620 

TACCTAGGAA ACCAACTGGC AATGCACCTT TTAAAGTATT ACGTAATGTT GTGTTGCGTT 4680 

TACATCTTAC CCAAAGTGCT AATGCGGCAC CTACTTGTCC AGCACCAGCC ATCGCTGCAA 4740 

40 TTGGCAATAA GTAAGTAGCA CCTGATTGGT TAATCATTTC TATATGAATT GGCGTAAAAA 4 800 

TATGATGAAG CCCTAACATA ACTAACGGTA GGAAGCTTGC ACCAATGATA AATCCACTAA 4860 

ATACGCCACC AATACTAATA ATTCCGTTAA CTACTGAAAC TAAACTGTCT GAAACAAAAC 4920 

CTGCTAATGG CATAAAGATA AAGATAGTTA ATAGTC CTAC AATCAACAAT GCAATAGTCG 4 980 

GCGTTACAAT AATATCAATC GCATTTGGCA CAATTTTATG TAATCTCTTT TCGACAATAC 504 0 

TTAAAATCCA AACGGCAAAA ATAACGCCAA TAATCCCACC TTGTCCAGGT TGCAATGGTT 5100 

CTCCAGTGAA GACATTCATT AAAATATTTT TACCAGCAAT ACCCGTTAAT AACGTTGTAC 5160 

CACCAATCAC GCCACCAAGT CCTGGTGTCG CACCAAATTC TTTAGCCGCA TTAATACCAG 5220 
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GCGTAATCCA AGCACCTGAA ATATAGCCTG 
TACCACCAAT TAATCCAGCT CCAATAAATG 
5 TTGATTTCAA TACTTTATTC AACTTACCAT 

TCGCCTTTGC TTTATCAGCT GCATATGATT 
GGTGTGGTAT TGGGTCACCT AGTTTAACAC 

w 

TATTGatGTA CCAGGTCCAA CCACAACTTG 
ACCATCAATA TGCCTTAGTT CTTGGTCATC 
CACACGTGTC ATACAGTTCA TGACACTATC 

15 

AATTCGTTCT GCAAGTTGTT GTTCTTTGGT 
CTGATTGCTC GTTTAAaATG TCACCATTGT 

20 AAATGCCACA CATACCCATA ACTGTCGCAA 

ACGCCATTGC TTCATCATAT GTG AT AG CAC 
CGATCAGTTT TTGATTGGTT GCTTTAACAT 

25 CACCAACCAT TGTGATGGTT GAAATCATAT 

TTAAACGTGT TGAACCAGTT AATACTT CTG 
CAATTTCACT TATAACTGCA TGTTCATTGC 

30 

TGTTAGCAAA TGTTAAACCG CCTATAACAT 
TAACGACATC TTTTGATGTT AAATCTATAT 
GATCTTCCGC ACCTTCTACA GCCATCGTCA 

35 

TAATTTCATG AGGGTCAGTA TTGAATGTAG 
ACCTTCCACT TGTACCTGCA CCGATATAAA 

40 TTGTTTTTTT AATTACTTTT GTCAATTGTG 

GCTGATCTTC TTTATTCATC GTAATTAAAG 
TCGTCGCTTC ATTACGCGCT TCGGTCGTAC 

45 TTTTTGAAAA TCAAATGTAT CATTCGGCTC 

AATAATTTGT GCAaCAACAT TCACATTGTC 
CATTTCGCCT TGATAACGTC CGTTATTCAA 

SO 

TTGCGTCGTA AACTGTGGTT GAATCGAATG 
AATGACATTT TCCGGATTAT CCGGGCGTAC 
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CCACCATTAA 


GTTACTCAGT 


ACTGCTGCAA 


5340 


CAGGAATCAA 


CGGTATAAAG 


ATATTGGCAA 


5400 


TCTTTTGTTT 


TGCTTTATGC 


GCTTCCTTAT 


5460 


TATAGTCCAT 


TTTTTCACTA 


TCATTGTGAT 


5520 


CACTTAATTC 


CGCCATATGA 


TTAGCCACTT 


5580 


AATGCGTTCA 


TCGTGTATAA 


CACCCATGAC 


5640 


TACTTTATTC 


TCATCTAATA 


CTTTAATACG 


5700 


TATATTATCC 


ATACCACCTA 


CTGCAGCAAT 


5760 


CATTTAAATC 


CCTCCTAAGG 


TTGTCTATCT 


5820 


TTAATAACCG 


TCTTGTTGCT 


TCTTCCTTAG 


5880 


CTTT CACATC 


ATGCTCAGAT 


ACCTGATATA 


5940 


ATATTTCTTG 


AATAATACGC 


ACTGAACGGT 


6000 


CAATCATGAG 


GTTATCGTAA 


ACTTTTCCGA 


6060 


TTAAAATTAA 


CTTTTGTGCt 


GTACCAGACT 


6120 


GACCAACTTT 


AAC TT CT ACT 


GGATAcTGCG 


6X80 


ATGAAATAGA 


TACTGTTGTA 


GCACCGATTG 


6240 


ATGGCGTTTT 


GCCACTCGCG 


GCAATTCCTA 


6300 


TTTTCAAATC 


TTCTTCCGCT 


AATTTTTTGT 


6360 


TAGCATGTTG 


TCCACCAGCA 


ATAATACCTA 


6420 


GTACACACTC 


CGCTGCATCT 


AAGACACCCA 


6480 


TCAATCGTCC 


ACCCTTTTTA 


TACTGTGCAA 


6540 


GTATTGCCTT 


TCGAACTGCT 


AACGGGACTT 


6600 


CCTCTTCCAC 


AGTCATTTCA 


TCAAGATGCA 


6660 


TATTTTCCAT 


CACTTCTTAC 


ACTCCCTAGT 


6720 


GATACAACTT 


AACAGTGGTA 


AGTCTTCTTT 


6780 


ATGTGCACTA AGCGTTTGTC 


TCACAATTTG 


6840 


ATTATCAACG 


GTTACTGAAC 


CAATGCGTCG 


6900 


TGGACATATT 


TGTCTTGACG 


TTTCCGAACG 


6960 


TTTATGACAC 


ATATCGAAAA 


GGTAAGTCAC 


7020 
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AAGTTGTTTT GCCTGCCTCA TTTCAATCAA TGAGTCTCCA ACTAACACTT CAGATACACC 7140 

AGTTTCTTGT AATAATTTAG CTGCAACGAC AGGATGACTA TGTCTCGTTG CTTCAATTGT 7200 

TGGCAAGCCT TTATGCAAAG GACCTCGCAA ATCACTCCCT ACAATAAAAC CATATATTTG 7260 

TGCCTTTGGA TTAAATTGAT AAATGAGTTC ATTTTTCTTA TTGACCAAGT CAACAGATAA 7 3 20 

TCCCGTATCT GGTCTTGGAT AATAGTTATG ACAAAATGAA AGTAATGTAA AATCATTCAA 7380 

TTGTTGATGT AAGCTTGTTA ACAATTCCCG GGAAATAATA CTTGCATTCA AACAGCACTT 7440 

TAAACCCTGT GCCATTATCG CTTCGATTGC CTCAATTGAT GTACTATGAT CGATACGAAT 7500 

CATAAATTGT GCATCATATT GTCGAAGATG GTCATAAAAA GATGGTGTTA AAATAGATGG 7560 

ATTAGCATCT ATGAGGTAAG TCACTTGTTC ATGTTTTAAT AAATTGAGTA GTTTTGTGAA 7620 

ATAATGATAT TTTGTCTCGT CATCTTCTTC TGGTATTTGT ACAGATGTAA AAATCATTTG 7680 

20 GTAACCTTGT TTAATCATTC GCTTAATATA CGCTTCATCT AAAGGTTGTC CTAAATACAC 774 0 

TGAAAAGCCT GTCAAAGTAG CCCTCCTTAA CAATATAATT ATTAGGAAAA TATAGTTGAT 7800 

TTGTGTAATC GCTTACATTT TACTATAAGA GAAAACACAT TACAATATTA AT CAGTT AAA 7360 

GCCTGTTCAT TGTAATAATC TTACATATTT CTGTCACAAG TTAATTATTA CACCATCAAA 7920 

GATTATCCTT TCTTTTAAGT G CTG AT AAT A GCTGCTACTG CTGGATTATT ACAATAACTT 7980 

TTATACATTT TATTCAGGAT TATCTTATAT TATGTTTTAA TAATAATCTG TGAACAATTA 8040 

AGAGATTTGA AATTGAATTT AATAATTGTA TTGAAAACGC ATACTTCACC ATGCTAAAAT 8100 

AGGAGTCGCA AACAAATAAG ATTCAATAAG ATGTGATGGT TACCAACACA GTCTATTTGC 8160 

TCGTGTCTTT TTTTATTGAA TCTTAAATAA TAAATACAAC TTTGGAGGTT GGACAAGTGA 8220 

GGAAGAAACT TTTCGGTCAA TTGCAACGTA TTGGTAAAGC GCTAATGTTA CCTGTTGCGA 8280 

TTTTACCAGC AGCTGGTCTG TTATTAGCTA TCGGTACAGC TATGCAAGGT GAATCATTAC 8340 

40 AACACTACTT GCCGTTTATA CAAAATGGTG GCGTACAAAC TGTCGCTAAA TTAATGACAG 8400 

GTGCTGGTGG TATCATTTTT GATAACTTGC CTATGATTTT CGCATTAGGT GTCGCAATCG 84 60 

GATTAGCTGG CGGTGATGGC CfTAgcAGCTA TCGCAGCATT CGTCGGTTAC ATAATCATGA 8520 

ACAAAACAAT GGGCGACTTT TTACAAGTTA CACCTAAGAA TATTGGTGAT CCAGCGAGTG 85 80 

GTTACGCTAG CATTTTAGGT ATCCCAACAT TACAAACAGG TGTGTTCGGC GGTATTATAA 864 0 

TCGGGGCCCT GGCAGCTTGG TGTTATAACA AGTTCTATAA CATTAACTTA CCATCTTATT 8700 

TAGGTTTCTT CGCTGGTAAG CGTTTCGTAC CTATTATGAT GGCTACAACA TCATTTATTT 8760 

TAGCATTCCC AATGGCATTA ATTTGGCGAA CGATTCAATC AGGATTAAAT GCATTCAGTA 8820 
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TATTAATTCC ATTCGGTCTA CATCACATTT TCCACGCACC GTTCTGGTTC GAGTTTGGTT 894 0 

CATGGAAAAA TGCAGCTGGT GAAATTATTC ACGGTGACCA ACGTATCTTT ATCGAACAAA 9000 

TTCGTGAAGG CGCACATTTG ACAGCTGGTA AATTCATGCA AGGTGAATTC CCTGTTATGA 9060 

TGTTCGGTTT ACCTGCAGCA GCTTTAGCAA TTTATCACAC AGCTAAACCT GAAAATAAGA 9120 

AAGTAGTAGC AGGTTTAATG GGTTCTGCTG CTTTAACATC ATTCTTAACT GGTATTACAG 9180 

AACCATTAGA ATTCTCATTC TTATTTGTAG CACCATTATT ATTCTTTATT CACGCaGTAC 924 0 

TTGATGGTTT ATCATTCTTA ACATTGTACT TATTAGATCT TCATCTAGGT TATACATTCT 9300 

CAGGTGGTTT CATCGACTAC TTCTTACTCG GTATACTACC TAATAAGACA CAATGGTGGT 93 60 

TAGTCATTCC TGTAGGTCTT GTATACGCAG TTATTTACTA CTTCGTATTC CGATTCTTAA 942 0 

TTGTAAAATT AAAATACAAA ACACCAGGTC GTGAAGATAA ACAATCACAA GCGGCTACTG 94 80 

20 CTTCAGCAAC TGAATTACCA TATGCAGTAT TAGAAGCTAT GGGTGGCAAA GCAAACATTA 954 0 

AACATTTAGA CGCTTGTATC ACACGTCTAC GTGTTGAAGT TAACGACAAA TCTAAAGTTG 9600 

ATGTTCCTGG TTTGAAAGAT TTAGGCGCAT CTGGTGTATT AGAAGTCGGC AATAATATGC 966 0 

AAGCAATTTT TGGTCCTAAA TCTGACCAAA TCAAACATGA AATGCAACAG ATTATGAATG 9720 

GTCAAGTAGT AGAAAATCCT ACTACTATGG AAGACGATAA AGACGAAACT GTTGTTGTTG 9780 

CAGAAGATAA ATCTGCAACA AGCGAATTGA GCCATATCGT GCATGCACCA TTAACTGGTG 984 0 

AAGTAACACC ATTATCAGAA GTGCCTGATC AAGTGTTCAG CGAAAAAATG ATGGGTGACG 9900 

GTATCGCTAT CAAACCTTCA CAAGGTGAAG TTCGTGCACC ATT CAACGGT AAAGTACAAA 9960 

TGATTTTCCC AACAAAACAT GCAATTGGTC TTGTATCAGA TAGTGGTTTA GAACTATTAA 10020 

TCCACATCGG TTTAGACACT GTTAAATTAA ACGGAGAAGG CTTTACTTTA CATGTTGAGG 10080 

AAGGTCAAGA AGTTAAACAA GGTGATTTAT TAATCAACTT TGATTTAGAC TACATCCGCA 10140 

40 ATCATGCAAA GAGTGATATT ACGCCTATTA TCGTGACACA AGGAAACATT ACAAACCTTG 10200 

ATTTTAAACA AGGTGAACAT GGCAACATTT CATTTGGCGA TCAATTATTT GAAGCTAAAT 10260 

AATGCTTACT ATAAACAGGT GCGTATACCT T CAT AAGGTG ACGCGCCTGT TTTTTCTTTG 10320 

CTATTGTATT TTGCAGCATC ATTGATAGTT CGCTCTCCCC TTAAATTTTG AATTTTAAGA 10380 

TCATCAATTA AAGCCCCCCT TCATACTCAT TTCCTAAAAA ATATTAATTG TTCACTATTG 1044 0 

TTAGCGTTTT CACAACAAAG TCAACTTCCT TGACCTTACA CTATATTCGA GGCTATCATT 10500 

TTAAGTGTAA ATATAGAGAA AAGGTGGCTT TTTTTATGAA ACAACGCATT GGAGCTTACT 10560 

TAATTGACGC TATTCATCGA GCAGGCGTCG ATAAAATTTT TGGTGTTCCT GGTGATTTTA 10620 
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ATGAATTAAA CGCAAGTTAC GCAGCGGACG GTTATGCCCG TCTTAATGGA CTCGCTGCAT 10740 

TAGTTACTAC ATTTGGTGTT GGCGAATTAA GTGCCGTCAA CGGTATCGCA GGTTCATATG 10800 

CTGAACGCAT ACCTGTCATT G CGATT AC AG GTGCGCCGAC ACGTGCTGTT GAACAAGGCG 10860 

GTAAATATGT ACATCACTCA CTTGGTGAAG GTACATTTGA CGACTATCGA AAAATGTTTG 10920 

CACATATAAC CGTTGCACAA GGTTATATCA CACCTGAAAA TGCAACAACC GAAATACCAC 10 980 

GTTTAATTAA TACAGCAATC GCCGAAAGAC GCCCAGTTCA TTTACATTTA CCAATCGATG 11040 

TCGCAATCTC TGAAATTGAG ATACCGACAC CATTTGAAGT GACGGCAACT AAATATACGG 11100 

ATGCATCAAC ATATATAGAG TTATTAGCAA CTAAACTGCA TCAAG CGAAG CAGCCT AT CA 11160 

TCATTACTGG ACATGAAATT AACAGTTTTC ACCTCCATCA AGAATTAGAA GATTTTGTAA 11220 

ATCAAACACA GATACCAGTA GCACAACTTT CATTAGGAAA AGGTGCTTTT AATGAGGAAA 11280 

20 ATCCATATTA TATGGGTATT TACGATGGGA AAATTGCCGA AGATAAAATA CGAGATTATG 11340 

TGGACAACAG CGATTTAATT TTAAATATTG GAGCCAAATT AACAGATTCA GCAACAGCAG 11400 

GTTTTTCATA CCAATTCAAT ATCGATGATG TCGTTATGTT AAATCATCAC AATATCAAAA 1146 0 

25 TTGACGATGT TACAAATGAT GAAATATCTC TACCATCATT GTTAAAACAG TTATCCAATA 11520 

TTTCATATAC GAATAACGCA ACGTTCCCTG CGTATCATCG TCCAACATCA CCCGATTATA 11580 

CTGTTGGCAC AGAACCATTA ACACAACAAA CTTATTTTAA AATGATGCAA AATTTCTTAA 11640 

AACCAAATGA TGTCAT CATT GCTGATCAAG GTACATCATT CTTTGGTGCT TATGATTTAG 11700 

CATTATACAA AAACAATACT TTTATAGGGC AACCGTTATG GGGTTCTATC GGCTATACAT 11760 

TACCTGCAAC ATTAGGTTCA CAATTAGCAG ACAAAGATCG TCGTAACTTA TTATTAATTG 11820 

GTGATGGCTC ATTGCAACTA ACTGTTCAAG CTATTTCAAC TATGATTAGA CAGCATATTA 11880 

AACCGGTATT ATTTGTGATT AATAATGACG GCTATACGGT AGAACGACTT ATTCACGGCA 11940 

TGTATGAACC TTATAATGAA ATTCACATGT GGGATTATAA AGCTTTACCA GCTGTATTTG 12000 

GTGGTAAAAA TGTTGAAATT CATGACGTTG AATCATCAAA AGATTTACAA GACACGTTTA 12060 

ATGCAATTAA TGGTCATCCC GATGTGATGC ATTTTGTCGA AGTCAAAATG GCTGTCGAAG 12120 

45 aCGCACCGAA GAAACTCATC GATAt CGCTA AAGCTTTTTC ACAACAAAAT AAATAATTTC 12180 

ATCGTATACA GGGTATAAGT TTAAGCGAAT ACTTTATTAA ACGAATAGGA CTCTGATATA 12240 

AGATGATTAA TTTTAATAAA ACCGCTTTAG TGTTAATCGA CCTGCAAGAA GGTATTCTTA 12300 

50 AAATGGATTA TGCCCCATAT ACAGCTGAAA ATGTCGTTCA AAACGCTAAT AAATTAATAG 12360 

ATGTTTTTAG AAAAAACAAT GGCTTTATCG CTTTTGTTCG CGTGAATTTC TATGATGGTA 124 20 
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AGTCGTTTCC ATCATTTATT AGACAAGAGA GATGACGATT TTGTCATAGA CAAACGACAT ~ 12540 

TTTAGTGCAT TTGTAGGAAC AGATTTGGAC TTACAATTGC GACGTCGAGG AATTGATACG 12600 

5 ATTGTTCTTG GTGGTGTCGC AACGCATATT GGCGTAGATA CGACAGCGCG AGATGCCTAT 12660 

CAATTAAACT ACAATCAGTT TTTTGTTACA GATATGATGA GTGCACAAAA CGAAACGCTA 12720 

CATCAATTTC CAATAGATAA TGTATTCCCA TTGATGGGAC AAACAATAAC TACAAACGAC 12780 

10 TTTCTAAATA TATTGAACTA AACATATACT TCCCCCCTTC GATCATGTTG AGGGGGATCT 12840 

TTATTTCACA AAGTATTAAT ACGTCGGGTT GTCTAACCTT CTATATTTAA CATATTCTAT 12 900 

ATCTGTTAAA TCGTTCTTAA CTTACGCCCC TACTACATAA AAAACAGTAT TTATTCCGGA 12960 

15 

ATTTTCAAAA AATTTAGTAT TTATTGCAAA ATTATGTATC ACTTTATGTT TAATTTTTGA 13020 

TATTATCTTA ATTAAGTAGA TTTTTATAAG TTCTAAAAAG GAGAACAAAT ACATATATGA 13080 

AGAAGAAACT AACATTTAAA GAAAACATGT TTATAGGTTC TATGTTATTT GGTTTATTCT 13140 

20 

TTGGTGCCGG CAATCTTATC TTCCCAATAC ACTTGGGTCA AGCTGCTGGT TCTAACGTTT 13200 

TTATCGCTAA CTTAGGATTT TTAATTACAG CAATTGGCTT ACCATTTCTA GGTATCATTG 13260 

25 CTATTGGCAT TTCAAAGACA TCTGGTTTAT TTGAAATTGC ATCGCGTCSXT AATAAAACAT 13320 

ATGCTTACAT TTTCACGATT GCCTTATATC TAGTTATCGG ACCATTTTTC GCCTTACCTA 13380 

GACTGGCAAC GACATCATTT GAAATTGCAT TTTCGCCATT TTTATCACCA AAGCAAATCA 13440 

30 CTTTATATTT ATTTATTTTT AGCTTCGTCT TCTTTGTGAT TGCATGGTTT TTTGCGAGAA 13 500 

AGCCATCAAG AATTTTAGAA TATATCGGTA AATTTTTAAA TCCGGTATTC TTAGTATTAT 13560 

TAGCAATTAT TTTATTATTT GCTTTTATCC ATCCATTAGG TGGCATATCT GATGCACCTA 13620 

35 

TTAGTAAACA ATATCAATCA CATGC CTTAT TTAACGGCTT TTTAGATGGA TACAATACCT 13 680 

TAGATGCGCT AGCGTCATTG GCATTTGGTA TTATCATTGT TGCAACGATT AAAAAGTTAG 13740 

GTATCGAAAA TCCAACTGAT ATCGCTAAAG AAACAATTAA GTCTGGTACT ATCAGTATCA 13800 

40 

TTATGATGGG GATCATTTAT ACCCTACTAG CAATCATGGG TACATTAAGT ATTGGTCATT 13860 

TCAAACTTAG TGAAAATGGT GGTATTGCCT TAGCGCAAAT TACTCAATAC TACTTAGGTA 13920 

45 ACTACGGTAT CGTCCTGTTG TCACTTATCG TTATGGTTGC TTGTTTAAAA ACAGCCATCG 13980 

GTTTGATTAC GGCATTTTCA GAAACATTCG AACACCTTTT CCCTAAAATG AATT AC CT AG 14 04 0 

CGATTGCAAC AGTTGTAAGC TTTATTTCGT TCTTATTCGC GAATGTTGGT TTAACTAAGA 14100 

SO TTATTATGTA CTCAGTCCCA GTGTTAATGT TCTTATATCC ATTAGCAATT GCCTTGATTG 14160 

TACTAACATT ATTTAGTAGC AAATTCCATC ATTCAAAACT TATTTATCAA TGTAC CATTT 14220 
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ATTTTACAAA 


fn/^'B ft nwn ft m r++ 

TCACATTAAT 


ACAAACACAA 


14580 




ATATTATTAA 


ATTTATATTT 


GACACTTATA 


fMHA ft ft ft ft MMH 

TTGAACAACT 


GTAATATATT 


14640 




AATATTAATT 


/inn «ti tv iv tv iv m/i 

CI 1 1AAAATG 


ffi m m ft ft ft m m #n ft 

TATAAATATA 


AAGGAGGGAG 


ACCGATGaAT 


TCAATCATTG 


14700 


15 


slATTAACTGA 


TTATTATAGC 


TCTAATAATT 


ATGCACCACT 


TAAGCTTGTC 


ATTTCTAAAG 


14760 




0 1 AAAUG I\» 1 


/^l IV TV IV. <*MI>HW »^ 

CAAAGTTTGG 


ft Mi ft. i_r~i ft 0 w\* 

GATACTGATG 


GCAAACAATA 


TATAGATTGC 


ATTTCGGGTT 


14820 




TTTCAGTTGC 


TV TV TV i^^t m <m m m 

AAACCAAGGC 


ft flvwauvtfn ft #V*>ft 

CATTGT CATC 


CAACAATTGT 


TAAAGCGATG 


ACAGAACAAG 


14880 


20 


CTTCAAAGTT 


GTCTATCATT 


TCACGTGTCC 


TTTATAGTGA 


CAATCTCGGG 


AAATGGGAAG 


14940 




7\ TV TV TV TV TV fpfWPP 

AAAAAATTTG 


TCATCTTGCT 


AAGAAAGACA 


AAGTACTCCC 


CCTTAACTCT 


GGTACTGAAG 


15000 




CTGTTGAAGC 


IV /^/^ *k MR IV IV % 

AGCCATTAAA 


ft MWV%^M J >«#n.ft ft ft 

ATTGCTAGAA 


AATGGGGCTC 


TGAAGTTAAA 


GGCATTACTG 


15060- 


25 


TV /™ , ^*/™» TV /""• TV TV j'nw 

ACGGACAAGT 


TGAAATCATC 


GCTATGAATA 


ACAATTTTCA 


CGGTCGTACA 


CTTGGCTCAT 


15120 




I ATCACTAT C 


m tv » tv iv 

TAAC CACG AC 


^*^«ft fv*ft mft ft ft 

GCATATAAAG 


CAGGATTTCA 


CCCCCTACTT 


CAAGGCACTA 


15180 




v_AAv-A(j lAbA 


l"l"ri\jGAGAC 


TV mm/1 Jk « -» Tk m 

ATTGAACAAT 


ft ft *m ft « m ^« 

TAACACAAGC 


TATTTCACCG 


AATACAGCAG 


15240 


30 


CAATTATTTT 


GGAACCAATT 


ft H J^WW\^^ ft ft ^ft 

CAAGGTGAAG 


GTGGCGTTAA 


TATACCACCG 


AAAGGATATA 


15300 




^^^^^^ ft ft^^^^^^^*^PJ 

1 1 v_AAG<«. rG x 


GCGTCAACTA 


IV #**iv TV IV 

TGTGATAAAC 


ATCAAATATT 


ATTGATTGCA 


GATGAAATTC 


15360 


35 


nnu 1 1 Vjvj 1L1 


TYVT TV TV TV /^*fv 

1 I AG AACT 


TV TV TV I fV'l /"OTl 

GGGAAATGGT 


TTGCTATGGa 


ATGGGAGCAA 


GTCGTTCCAG 


15420 


A Ui 111 Al AT 


TTTAGGTAAG 


GCATTGGGTG 


^^^^ ^^MWW ft #V4 ft 

GCGG CTTATA 


CCCTGTATCT 


GCTGTACTTG 


15480 




CAAATAATGA 


TGTCATGCGT 


GTTCT AA GAC 


^> TV r^^l m 4k TV /"I « 

CAGGTACACA 


TGGTTCAACA 


TTTGGTGGTA 


15540 


40 


ACCCTTTAGC 


CATTGCAATA 


NV/V* TV TV ^ 

TCGACGGCAG 


CGCTTGATGT 


ACTTAAAGAT 


GAACAACTGG 


15600 




TTGAACGATC 


AGAACGCTTA 


GGTTCATTTT 


^T*M T» TV TV IV TV 

TATTAAAAGC 


GTTGCTACAA 


CTTAAACATC 


15660 




CTAGTATTAA AGAAATTAGA 


GGTCGTGGTT 


ft MMm#«%ft #w ft ^m*m 

TATTTATAGG 


CATAGAGCTT 


AACACAGATG 


15720 


45 


CTGCACCTTT 


TGTGGATCAA 


/ **i TV T^TP^ TV TV /""• 

CTGAl iCAAC 


GTGGAATCTT 


ft rfW^^^ ft m m m 

ATGCAAAGAC 


ACGCATCGTA 


15780 




CTATCATTCG 


ATTGTCTCCA 


CCTCTAGTCA 


TTGATAAAGA 


GGAAATCCAT 


CAAATTGTTG 


15840 




CAGCTTTTCA 


AGACGTTTTT 


AAAAATTAAC 


AATTAATCAT 


TTATATATGA 


CATAGGAGGG 


15900 


50 


ATTCATGATG 


ATTAAAGTAG 


GTATCGTTGG 


CGGTAgcGGT 


TATGGCGCAA 


TTGAATTAAT 


15960 




TCGATTGTTA 


CAAACACATC 


CTCATGTAAC 


GATTGCACAC 


ATCTACTCAC 


ATTCAAAAGT 


16020 
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ACTTACAGTG 


GaTAATAATG 


ACTGTGATGT 


AATTTTCTTT 


GCGACACCAG 


CACCCGTAAG 


16140 




TAAAACATGT 


ATCCCTCCCT 


TAGTAGAAAA 


AGGTATTCAT 


GTTATCGATT 


TATCTGGCGC 


16200 


5 


ATTTAGAATT 


AAGAATCGTG 


AAATATATGA AGCATATTAC 


AAAGAAACTG 


CTGCAGCACA 


16260 




AGATGATTTG 


AATCATGCTA 


TTTACAGCAT 


TTCAGAATGG 


CAATCGTTTG 


ATAACAATGG 


16320 


10 


AACGAAGCTC 


ATTTCTAATC 


CTGGCTGTTT 


CCCTACAGCA 


ACATTATTAG 


CATTACATCC 


16380 


ACTTATTAGC 


GAAAAAATAG 


TAGATTTGTC 


ATCTATTATT 


ATTGATGCTA 


AGACCGGCGT 


16440 




GTCAGGTGCT 


GGTCGTTCAT 


TATCACAACG gTTcATTTTT 


CAGAAATGAA 


TGAAAATCTA 


16500 


15 


AGCGCTTATG 


CAATCGGAAA 


CCATAAACAC 


AAACCGGAAA 


TCGAGCAATA 


TTTATCTATC 


16560 




ATTGCGGGTC 


AAGATGTATC 


AGTCATATTT 


ACACCACATC 


TCGTACCAAT 


GACACGAGGT 


16620 




ATTTTATCAA 


CAATATATGT 


CAAATTATCA 


TCTGAATATA 


CGACTGAATC 


ATTACATAAA 


16680 


20 


TTAATGACCT 


CTTATTATGC 


TAATCAGCCA 


TTTGTCAGAA 


TTAGAGATAT 


tgggactttt 


16740 




CCAACCACAA 


AAGAAGTACT 


CGGTAGTAAC 


TACTGCGATA 


TCGGCATCTA 


TGTAGATGAA 


16800 




ACAACGCAAA 


CAGCAATTTT 


AGTATCAGTG 


ATTGATAACC 


TTGTCAAAGG 


CGCAAGTGGG 


16860 


25 


CAAGCCATTC 


AAAATTTAAA 


TATATTATAT 


GATTTTGAAG 


TGACGACTGG 


CCTAAATCAA 


16920 




TCACCAGTTT 


ATCCATAAGG 


GGTGTTAGAA 


TGAAACATCA 


AGAAACGACA 


TCACAACAAT 


16980 




ATAACTTTTC 


AATTATTAAA 


CATGGCGATA 


TCAGTACACC 


TCAAGGCTTC 


ACGGCTGGTG 


17040 


30 


GTATGCACAT 


CGGTTTACGC 


GCTAACAAAA 


AAGACTTTGG 


GTGGATTTAC 


TCATCGTCTT 


17100 




TGGCAAGTGC 


AGCTGCCGTA 


TATACTTTAA 


ATCAGTTTAA 


AGCTGCACCA 


CTTATTGTCA 


17160 


35 


CTGAAGACAC 


TTTACAAAAG 


TCTAAAGGAA 


AATTACAAGC 


ACTTGTTGTT 


AATTCAGCTA 


17220 


ATGCAAATTC 


TTGTACCGGT 


CAACAAGGCA 


TAGATGATGC 


ACGACAAACA 


CAAACATGGG 


17280 




TTGCTCAACA 


ACTTCAAATA 


CCATCTGAGC 


ATGTTGCTGT 


TGCTTCAACT 


GGGGTCATTG 


17340 


40 


GTGAATATTT 


GCCTATGGAT 


AAAATTAAGA 


CTGGGACCGA 


ACATATTAAG 


GATGCTAATT 


17400 




TTGCAACGCC 


AGGTGCGTTT 


AACGAGGCAA 


TTTTAACAAC 


TGATACCTGT 


ACAAAACATA 


17460 




TCGCTGTATC 


ACTAAAAATC 


GATGGTAAAA 


CCGTTACAAT 


TGGTGGTAGC 


ACCAAAGGTT 


17520 


45 


CAGGTATGAT 


TCACCCAAAT 


ATGGCTACCA 


TGCTTGCTTT 


TATAACAACC 


GATGCATCGA 


17580 




TTGAATCGAA 


TACACTTCAT 


CAATTATTAA 


AATCTTCGAC 


TGACCATACA 


TTTAATATGA 


17640 




TTACTGTTGA 


TGGCGATACA 


AGTACAAATG 


ACATGGTATT 


AGTCATGGCA 


AATCACCAAG 


17700 


50 


TTGAACACCA 


AATACTTAGT 


CAAGACCATC 


CACAATGGGA 


AACATTTGTT 


GATGCATTCA 


17760 




ATTTTGTCTG 


TACATTTTTA 


GCTAAAGCTA 


TAGCCAGAGA 


TGGCGAAGGC 


GCAACAAAGT 


17820 
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CTATCGTAAG 


TTCAAATCTA 


GTAAAAT CAG 


CTATTTTTGG 


CGAAGATGCC 


AATTTTGGTC 


17940 


GAATCATTAC 


AGCTATTGGC 


TACAGCGGAT 


GTGAAATTGA 


TCCTAACTGC 


ACATATGTTC 


18000 


AACTGAACCA 


AATACCTGTC 


GTTGATAAAG 


GTATGGCTGT 


ACTATTTGAT 


GAGCAAGCTA 


18060 


TGTCGAATAC 


ATTAACTCAT 


GAAAATGTCA 


CAATTGACGT 


TCAGCTTGGT 


TTAGGTAACG 


18120 


CTGCAGCGAC 


TGCATACGGT 


TGTGATTTAT 


CCTATGATTA 


TGTGCGTATC 


AACGCATCAT 


18180 


ATCGAACATA 


AGGTGGTGTT 


GGTTAGATGA 


AATTTATTGT 


CATTAAAATT 


GGTGG CAGTA 


18240 


CACTTAGTGA 


CATGCATCCA 


TCAATTATTA 


ACAACATTAA 


GCATTTACGA 


TCAAACAACA 


18300 


TCTACCCCAT 


TATCGTTCAT 


GGCGGTGGCC 


CATTTATTAA 


TGAAGCATTA 


TCAAACCAGC 


18360 


AAATCGAGCC 


ACACTTTGTT 


AATGGCCTAA 


GAGTGACTGA 


TAAAGCAACC 


ATGACCATTA 


18420 


CTAAACACAC 


GCTCATTGCA 


GACGTTAACA 


CTGCATTAGT 


AGCTCAATTT 


AACCAGCACC 


18480 


AATGTTCTGC 


AATAGGCTTA 


TGTGGTTTGG 


ATGCACAGCT 


GTTTGAAATT 


ACATCTTTTG 


18540 


ATCAACAATA 


TGGATATGTC 


GGTGTTCCGA 


CCGCTTTAAA 


TAAGGATGCT 


TTACAGTATT 


18600 


TATGTACTAA 


ATTTGTACCT 


ATCATCAATT 


CGATTGGTTT 


CAATAACCAT 


GATGGAGAAT 


18660 


TTTACAATAT 


TAATGCTGAC 


ACGCTTGCCT 


ATTTTATTGC 


ATCATCATTA 


AAAGCGCCTA 


18720 


TTTATGTATT 


AAGTAATATT 


GCAGGTGTAC 


TCATCAATGA 


TGTTGTTATA 


CCTCAATTGC 


18780 


CATTAGTCGA 


TATTCATCAA 


TATATTGAAC 


ATGGTGATAT 


TTATGGAGGT 


ATGATTCCCA 


18840 


AAGTGCTAGA 


TGCCAAAAAT 


GCGATTGAAA 


ATGGCTGTCC 


TAAAGTTATC 


ATTGCATCAG 


18900 


GAAACAAGCC 


AAATATCATT 


GAATCTATTT 


ACAATAATGA 


TTTTGTTGGC 


ACAACAATCC 


18960 


TTAATTCATA 


ACTATGAAAT 


TAAGGCCTAA 


CAAGTTTTGA 


CACGCGAGAT 


GATTCCAGTT 


19020 


CGATTATCCA 


TTGCGCTAAA 


ACATTTATTT 


ACCGTTCATC 


TCGTTAACAA 


TTTTGAATAC 


19080 


AGTSCGATAC 


AATATGAGAT 


GTAAAAAACT 


AATAACCTTT 


TACAAATTTG 


TTTATCAAAA 


19140 


TATTTTAAGT TTTGCAAAGC TTTTTATTGT 


GATTATTTTC 


ACAAAATACT 


ATAATGAGGA 


19200 


TAGTAAATAG 


AGAGGAGTCC 


TTAAGTTGAC 


GAAACGACAA 


ATGGGTATAT 


TCATTTATGC 


19260 


TGGAATTATC 


GGTGGCTTGT 


TATCTGGAAT 


TGTAAAATTA 


GGTTGGGAGG 


TCATGTTTCC 


19320 


ACCTCGCACA 


CCAGAACGTA 


ATGCAACGAA 


CCCACCTCAA 


GAGTTATTGC 


AACAATTAGG 


19380 


ATTTAGTAGT 


GAGTTTACGC 


ATCAAACATA 


TACATTTTCA 


AATATGGAAT 


TGCCTTGGGT 


19440 


AAGCTTTATT 


GTCCACTTTA 


GTTTTTCTAT 


CGTCATTGCA 


ATTATTTACT 


GCATATTAGT 


19500 


TAAAAAATAC 


GCTTACTTAG 


CAATGGGACA 


AGGTGCTGTT 


TTTGGTATTG 


CTATTTGGGT 


19560 


ATTATTCCAC 


CTTATCATTA 


TGCCAATCAT 


GCATACTGTA 


CCTGCTGTGT 


GGGATCAACC 


19620 
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AGTGCGACAA CATTTTGTCT ATCGCTATAA ATTAAATTAA TACACTGACT AACATTAAOG 19740 

TGAGTTTtAA ATCATCGTTT GAGTATGATG ATTGATGCTC ACGTTATTTT ATTAACTGAC 19800 

ATGATATGAT TCCAGCCAAC TTACGTGAGC ATTAAAGTCT CAAATG CGTC GTAACAAACT 19860 

ATTATTTTCG GTAATTTCAA TATTGCTCAG TATATTTTTA CCTTATCACT TACTTTAATC 19920 

TCGTCATGAT TTTGAATGAT GCCATCGTGT ATTCACCTTT CATTTTTCCA ATAAAAAAAC 19980 

ATCTAACAGT AAACATTTAG GCAGTATAGT TTAAAATCAC TGCGCAATGA TACTGTCAGA 2 0 04 0 

CGT CAT ATT A ACTACTCAAT AACTGAAATA CAGACACTTT TTTATAACCC CAGGGTGCCT 20100 

GTCCTAAGAA ACATACCTGT ACCATAAACT GATCAAAAAT AAATTGTTTG AACTTCACTT 20160 

CACGTGATTG ATAAAAGTGT GATTGTGTCA TATCATAAAT GTCCAATCCT TTGATTAAAC 20220 

CTTCACCAAT CAATTTTGTA AAACTTTCTT TTTGTGTCCA TATTTGATAA AAATCATTTA 20280 

AACTACATAT TTGATGTGCT TCGTTTGTAG AGAAACACGT CACTAACGTA CGCCAGTCTA 20340 

AACGTTGTGA TATCTTTTCG ATATCAATAC CAACTGGTTC TTTATCGACA ACACACACGA 20400 

TATAAGGATA ACTATATGAT AAGCTCACAT AGATGGGCTG TCCATCACGA TTGTGTTGAA 20460 

CAATATCTGC CTTACCTCGT GGCGAAATGT GATAATGCCA TTCATGTGGT AATAAACCTG 20 520 

TGTCATGTTG AATTCCATAT TGCACTAAAA TATCTCCCAA TCTGTGCATG AGTTTATCTT 20 580 

GATTGTATCT ATAGTTGACT GTACGCGGTT TTTTATATGA CCAACGACTT TGTGATATTA 20640 

ATTCTTCAAT ACTTTTCAAG TTACTCTGTA ATTGCATTAC AAATACTGTC AT AACTTTC C 20 700 

CTACTTACTT ATTGAATATT GTTTTGATAT ATTGTGCCCA ATGATACAGC CAATTGTTAG 20760 

TTATCGTTGG CCATTTTTCA CTGATGTGAT TCATTATTTT TAATGTTAAT GTTGTATCTA 20 820 

TCATTGCTAG TTGTTGTTCA CGGTCAACAC TAGTTAATCC AATCGTTTCG TACATGTCTT 20880 

GTTTCTGTAA AATTTCATTA AATGATTCAT CGCTGACGAG TTCAATTTCT TTGCGCTTAA 20940 

CG CATTCTAA CAAAGATTTC ACCGGCATTT TATTAGGTGA TAGCACATGG TAAATGATTT 21000 

GTGGTGTGTT GACCTGTGCT AATGCGACAA TTTGTCTTGC AGTCGTATCC ACAAAAGAAA 21060 

AATCTACAGG CATTTCAGCC ATGCTAACCC CGATACAATC CAGTTGTAAC AAATCATTCA 2112 0 

TTACCATTGA AAAACGGTTA GTCTTTATAT TTCTCATATG CCATCTTCCA TTGTAAGGAT 2118 0 

TCGTCAAATT ACCAACACGT ACAATC CGAC CATCTAAGCC ATTATTTACA GCTTCTAATA 2124 0 

CTTTTAATTC ACTATAAAAT TTGCTCCGTG TATATGGTGA TGTTAGTAGT TGCCCTTTAT 213 00 

AGACATCCGC TTsTGAAAAT GTCACATCTT CTGTGTCTAT ATCAAAATAA GTTCCCACAC 213 60 

TTATCGTAGA CACATATATT AACCTTGCAT GATGTTGTTG TGCCAAACGT ATGACATCAA 21420 
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CACCTGCATG AATAATCGTA 
AATCACCAAC AATGACTTCA 
AATCATTTAA ATTCGTCATC 
AACAATAAAT GCGATGACTG 
CTGTCGCGCC AGTCAATAGT 
TACCCAAGTT ATAACGAGAC 
CAACTAATGA TTGTTGATTT 
GGTATAATGT CTGCATTGAA 
TCGCCTCTAA TGAGTTACCA 
GTTTCAATAC CTCTCCAAAT 
TATACACTTT ATTAGACTGT 
TGTCATTCGT GGTTAATGGC 
TAGG CAGCTG ATCATTTAAA 
AATAAGCATT CAATATATCA 
TACCACGAAT AGCTAATATT 
CTTTCACTTG TTTATCTATT 
CTAAATCACC ACTATGATAC 
CCATTAATTC TGGACGATTA 
CGCCTGG CAT ACCAATACCG 
ATAAGGGTTT GCCAATTGGA 
ACGATGTGAT GACTGTTGAC 
TCTCAATATA TTTAACAAAG 
TATAAAAGTC TTCCATAACA 
GCTTATTAAT GAGTTGTTGT 
CAAGCGTATG ACCATTTAAC 
TATTTGCATG TTGCAAAAAT 
GCACTAAATT CAACAAATTT 
CAGATGTGTA AATAGCATAC 
CATGTAAATC ATCATATTGT 



TCCATGTTTT 
ATGTTTGATA 
AACTTATACC 
TATCCTTGTA 
GTATTTCCTA 
ATAACAATCT 
TGGTACATAT 
ATATGATGGC 
CCAAGTTCAA 
ACATCAACAA 
TGTATAGGTG 
ATACAATCGA 
TATTGCTTCA 
TGCGTATCAA 
GCATTTTCAA 
CTTCCTAAAA 
AACTTTCCTT 
ATATATCCTA 
CATAACAAAC 
ATCGTCTCAG 
TCAGATGGTC 
GATGC CGTAC 
CTACACATCT 
AACTGTTCTG 
AAACAACAAT 
ACTTCATTGT 
CGTTGTCGTA 
ATCTCATTAT 
TCATTTTCCT 



CTGGTAAAAC 
ACATTATTTC 
ATGCTATTTC 
GTACTTCAAT 
GAGGTCGATG 
TTTGTAATTC 
AATTAACAAT 
CAAATCGTTT 
AGAAATCATC 
ATGTCTGCTC 
ATGGATTTGG 
TATGCGTTAT 
AATCCTGTTC 
AGTGACTTAC 
TTTCATCAAG 
ATTCAATTTG 
TACCAAATGG 
TCGCTAAACT 
CATCTGACAT 
GTATCAAATC 
CAT AGG CATT 
TAGTTGCCCC 
GTAACGGAAT 
GATTAACACG 
AAATCTCCAT 
CGCCTAATTG 
TGGCAACCCC 
CTAACATCGC 
TTGATTCAAC 



AACAT CATC C 
AACCGTCTCT 
CTCATTATCA 
CAGATAAGCA 
ACTTAGACTA 
CGAAAGATTA 
CTGTCGCACG 
TAAATGCGAG 
GTCAACACCG 
AATTTCATTA 
CAAACGCGTA 
AGTCTTAGGA 
CACTTGTTGC 
TGTTACAACA 
TTCAATACGG 
ACCATCAGAT 
ATTATTTTGC 
ATCACCTGCA 
AATATACACT 
ACCACAATGA 
GAAATACGTG 
GCCTGTAATC 
CGACGCAACC 
TTCCTCTCTA 
AACTGATGCA 
CAATTCAGTT 
TTTAGGCATC 
TGTGTTTTCA 
AAAGCCTTTA 



ATACACTCGA 
TCTGAAAAAT 
GCACGTATGA 
CCTAAAAAAC 
TCCTCTAAAA 
TCCGGTAATG 
GTTTTATATT 
ACAACTAACA 
ACATCATTTT 
GAGGGTTCGC 
GTATCCACCT 
ATCATATACT 
TCTCCGACAT 
CAATCAGATA 
TACCCGTTAA 
GTATAACGTG 
CATTTATCAG 
ATACACAACT 
TGGATGTTAG 
TGTGACCAAT 
CCACAATGCT 
AACTTTTCAA 
GTCACACGAT 
TCTGGAATCA 
TCAAAAACAA 
GACCATGCAT 
CCGGT CGTAC 
AGTTGATTGC 
GCATTTTCCA 



21540 

21600 

21660 

21720 

21780 

21840 

21900 

21960 

22020 

22080 

22140 

22200 

2226a 

22320 

22380 

22440 

22500 

22560 

22620 

22680 

22740 

22800 

22860 

22920 

22980 

23040 

23100 

23160 

23220 
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TAGCATCCTC 


CAAAATTGCA 


CCTTGTCGTT 

A A \J A \wV« A A 


TATTCGGAAA 


ATCAATATCG 


ninVjVj 1 n An A 


- 

23340 


AAGATGCACC 


TACTTTAACT 


GTCGCCAACA 


TCGCCGCAAT 


CATTTCAAAA 


PTArriTTOTr: 

V» A rtUVj 1 1V> IvJ 


23400 


TAAACAAGGC 


AAC CCGTTGA 


CCATTGCCCA 


CACCATTTGA 


TAGGAGCATG 


TGPGC^AATfV; 


~i ~1 A £ r\ 

^3460 


CATCCACATA 


GTTGCGTAAT 


GTTTCATACG 


TCATTGTCAA 


ATCATTCATG 

«m A V*** A A \ i ■» A \^ 






CATGATT AC C 


TTGTCGTGAG 


ACAACTTCAT 


TAAAGTAACT 


TATGATAGAT 


A An A 1 l\wV\,VJ 




GGACATTAAG 


CATTCG AT CG 


TTAACATGCG 


TATTGACCCA 


ATTTAGAAGT 


A \«\« A A VJV., 




CGTTTGGTAT 


ATCACAAATT 


TGTAGTGTAT 

A A «n# A w A «• A 


CTTGATGCTT 


CAAAATATAA 

WWW* A A rtrt 


TPAATPATAA 
lwv\l Ann 


^ "3 t f\ f\ 


TCATACATTG 


ATTACCCATG 


TGACGAACTG 


TTTCTGAGTG 


ATATAAATCT? 




aJ /o0 


CGATATTGAT 


TGTATAGTCA 




CTTCAATGAT 
x— A Aw<nnA\jnA 




lUWil 1 IWWr 


o "5 a o a 
Aio20 


CCGTCACTGA 


TTTGGGTTGA 


ATGTGTGTFTA 


nA A l/lXriAlU 


CCCAAAATfSA 




o 1 o a rt 


TTTCATTGTT 


TTFGTAGTACTT 

A A VJ A A A 


AACATGACAT 


CAAATAATGG 


AAA V— V_0 1 Vj/WsJ 


n 1 L-n 1 IVy 


O ^ ft Jt ft 

23 94 0 


ATTGATCTAA 

A A A A riTk 


GTCATTTACTT 


AAACATTCGA 




A 1 urn aVja- X V.ur 


1 n 1 1 V_s_n 


24000 


AACTCATTTC 


CTTAACCTCT 

^» A A A V* A 


TGTAAAAACT 


w A W A V«WtW\ A 


A A lAlWlVJUl 




24060 


CTCTATATAC 


CAACGTATTA 


GCAAAC!ATG£ 


f '~ J V&^^&*I M I M IV — 
V» A nw*wn AAA W 


V- A V-Vj lwvv A 




24120 


GCGCACTCAT 


CACACTACCG 


ACAACAACAT 


A \v A A A A W\J 


AGCAT ATPT A 


V* X 1 aaLaaLu 




TCATGACCAC 


ACTCATAAAG 


AACATAAAAT 


CAGTAATTTTS 


nA\J\a»A A A A ^» A 


auaIaL 1111 




GAAGTAGCTG 


T CT CATTTGT 


TCI A / T vr Pf* ATTY1 

A A A 11 A A 


TAAATGACAT 

A •••••• A VJn\«n A 


CATTGCTCCA 


A A A O A V—VJ AAA 




TAATATTTGG 


T CT AACAT AG 


TCPGTCGGTA 

A A A %»^^S* A mm 


AGCTTAAAAT 

• A A J^r*nn A 




A \* A A lUAAl A 


A^ *1 J O \J 


GAGATAACCA 


ATATTGTCTA 


TGTTTCGTCA 

A AAA A 


TATCACGATG 


CGACATC CAC 


TCACTATAGT 

A VAV» A A A^\w A 




CTTTATATTG 


CAATTTAAGT 


GGTAACAATA 

A • mm »^n^ mm m A m m 


ATTTATGTTG 

• • * A A • » A \mf A A 


ATAAAGTGCG 


TTAAGATCAT 


244 SO 

A>Hnt Ow 


TCATTAATTG 


TATATTACTC 


ATACCGTCAT 


TAATGATATG 


ATGCGTATCT 


ATAAAGAGGT 

A4AAAVMWVJ A 


A> *t W *B V 


ATGCATGTAA 


GGGACTTCTA 


ATGTATCTCA 


CTCTAATTTG 


ACTTTGGiCTTT 

• A A A A A 


TCCAAATTAA 


24600 


AAGGTGCTAC 


AAATTGGCGC 


ATGATTTCTT 


GTTCATCCGT 


AAAATGCGTG 


TTAACTTCTTT 

■ A A^W^Vb A A \^ A A 


24660 


CAAAGTCAAC 


TGCAACATCT 


GCCACAATAC 


GTTGTCGAAC 


CTCATCATCT 

V» A A V*n A Sw A 


ACAACAATAT 
AWinw^n A n A 


24720 


ATTGTGTTCG 


TAAAATCTCA 


TGTCGCGCTA 


TCAAACGCTG 


A W« A A \»J A 


CGCAATTGAG 


24780 


CTACATTAAG 


TTCTGATGAT 


AACCGC CATA 


AAAAAGGTAC 


GTT ATACAC C 


GTATCTTTAT 


24840 


GGTTTGATTT 


C CAT AAT AAA 


TACATACGCT 


TTTGTGCAGA 


GCTCAGCACA 


TAATCATCTT 


24900 


TAACTATAGT 


TTCTGGAATC 


ACTTCATAGT 


TTTGTTCTTG 


AACCTTAGCA 


ATCGCTTGTG 


24960 


CTAGTTCAAA 


TACAGTTGGC 


TTTTGTAATA 


AATCACCAAT 


TTGTAATCGT 


TTCCCAGTAG 


25020 
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AATTATCATG AATACCTACT TGATTCACAT GTAAAATATC TGCAAAAATT TGGCATAGCA 2514 0 

AGTGTTCGGT ATCTGTACTC GGTGCTACAT AGGCATCCGT ATCGACATAG TCCATGATAG 2 5200 

GCAATGCCTT CTTATCTAAT TTCCCATTAA TAGTAATAGG AATTTGCTCA ATATGCATGA 25260 

AATTAACTGG TATCATGTAC TCCGGTAAGG TCATACGTAA TTGTGATTTA AT CTT ATT AT 2 5320 

GTGATAATGT ATGCATCGCT TCATAATAAG CAACGATATA CTGATCTTGA TCATGATTTT 253 80 

GAACAATAAC AACTGCTTTA TTAATACCTT GTATACG CTC GAG CGCATGC TCAACCTCTG 25440 

ACAACTCAAT CCTAAACCCT CGAATCTTAA CTTGTTTGTC CTTTCGATAT AAATAATCTA 25500 

TGTTGCCATC GGGTAACAAA CGAACGATAT CACCACTTCT ATACATCAGC TGaTTTATAT 25560 

TTGAATCTTT GATAAATTTA TCTGCTGTCA ATTCTGGCTG ATTTAAATAA CCTGCAGCTA 25620 

ACCCAAAGCC ACTTGTACAT AATTCTCCAG GAATACCAAC GCCACACCGA CGCTCGCCTT 25680 

20 GCATGATATA AACATGAGTA CCCAGAATCG GTTTACCAAT AGGAATACGA TTTGGAACTT 25740 

TGTTAGGTAT ATTATACGTC GTTGTAAATG TTGTATTTTC AGTTGGTCCA TAACCATTAA 25800 

TAATTTGAGG ATG CTTCGGT TTTTGATTAA GCAAATCCAC CCACTTAGCA TTCAATACTT 25860 

25 CTCCACCAAT TAATAAATAC TTTAACGGTA CCAATACTTC TATTCGTTCA CTAGCAATCT 25920 

GATTAAATAA TGAGGAGGTT AACCACATAG TATTAACGTC ATTTTCATTG ATTAATTGTT 25980 

CTACCGCTAT TGGATTTAAT AATTGTTCTT TTTTAGCAAC AATCAGCTTT CCACCATTGA 26040 

GCAATGCACC ATATATTTCA AATGTTGCAG CATCAAAGGC TATAGTTCCT GATAACAAAA 26100 

TCGTCGTCTC TTCATTTAAT GGTACATAAT GATTTTGATG GACCAAGCGA ACAATACCTC 26160 

GGTGCGGAAT TAGTGTCCCT TTAGGGTTAC CAGTTGTCCC CGACGTGTAA ATAACATAAG 26220 

CATGATCTTC TAACGTGTTA CATTTAGAAA GATTATCAAT ATTTTTCCAC GCTATCTTAT 26280 

TCAASTCAAT GTGATTAATA TTTTGTTTAC CATTTTCATA TAAAGCTTGG TACGTTATTA 2634 0 

CAACTTTAGG CGTTACATCT TTTAAAATGT ACTCCTGACG ATCACTTGGA TAGTTCGGAT 26400 

CAATTGGCAC GTAAGCCCCA CCAGCTTTCA ACACACCTAT CATCGCTATT ATCATCTCAA 26460 

TACTTTTTTC AGCTATGACA GCGACACGAT CATTAGGTTC AACACCATAC TGGTTTCTCA 26520 

45 AACGGTGTGC TAAATCATTC GCGCGTGCAT TCAATGTTTG ATATGTTATA AACACTCCGT 26580 

CAAATTGCAC AGCGACATGA TTCGGCGTTG CTTCAACTTG TTGCTCAAAT AAGGTAACAA 26640 

CTGTTTGCGC ATCATCTATC TCAGGCAAAC TTAAATTGAT ATCGTCATAT AATTGAATAT 26700 

50 CACGTTCTGT CATCAAATTA AGTTCATCTA CAGTTGTTCG TTTATTTCCA TTTTCTTCAG 2676 0 

TAATTTGCAA ATAAATATTT CGAACTAAGT CACTCAGCGT CTCGATTGAG AGCAAATCAT 26820 
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CTAAAGATGT 


ATGTGCATCA 


TGTATTTGAT 


GTACATCCTC 


AATAACATCA 


TTACAACAAG 


26940 




ACATCATATG 


ATGATAACAA 


TGAAAAATAG 


TCTCTAGTGA 


AAGCGAAGAC 


TTCGCGCACT 


27000 


5 


GTAATTGCGA 


CATATTTTGC 


AACACACATT 


TATTAAAATC 


TGTTGTAAAA 


CGTTGACATA 


27060 




CATCTTTTGC 


ATCGATTGTT 


AACGTTAACG 


GCACAATATT 


TCCGTGTAAA 


TCATTTGGTA 


27120 


10 


AATGTGATGG 


TACATGTATA 


CCTAATGTGA 


CATCATGTTG 


TTGACTCATT 


ATATGATTAG 


27180 




CTAAATACAC 


ACTAACAGCC 


AACGATGCCA 


TATCTATTGA 


TGTCATATCA 


TCAATCAAAT 


27240 




ACGTTTGATA 


TAAAGCTTGT 


TCAAATGGAT 


GCTTAATTGG 


AAAATAACTA 


TCAATATGGA 


27300 


15 


TGTCAGAGTT 


ATTCTCTAAC 


CGAAAATAGT 


TTGAGTCTAA 


TGCTATATGC 


GATGCATCTT 


27360 




GATTGTCTTT 


ATCATCATTT 


CTATTTATAT 


GTGCATGCTG 


TCGAGTATTG 


TTAATAACAG 


27420 




TATTGCCACG 


ATATGCATTG 


CATAAATCAT 


CAAGAAnAAT 


ATCAATTTGA CTATCATCga 


27480 


20 


AAATGGaCAC 


ATGAAAATCT 


aATAGTATAT 


ATGcAGCATC 


AGCGAACTGm 


AACAATTTAA 


27540 




CTTTGAATAA 


AGGTGAATCA 


TTAAAATGGT 


AAGTACTTAA 


TTCTTGCTTA 


AAAAAAGCTT 


27600 




CTAAATCATA 


GTTTGCGGAA 


GAAGATGGAA 


CTTGTTTTAT 


CTCAATAAAA 


GGCAGAAATT 


27660 


25 


CATGAAGTAT 


CATTGTTAAA 


TTGTCATCGG 


TAGTAACATC 


AAAAAAATGT 


CTTATAGATG 


27720 




CATGTTGTgC ACAATTGTCG 


ATAATG CAT A 


CATCATTTTA 


GTAGCTTCAA 


CA'rrrrrAGC 


27780.. 


30 


GAGTTTAACC 


CAATACGCAT 


TACGGTGTGT 


CGTTGATTCT 


GTATTATTTT 


TGTATATACG 


27840 


AAAATATTCC 


TGTTGAAATC 


TCAAATTACC 


CATAATCATA 


AAAAGTCCTT 


CTTTCATATC 


27900 




ATAATACTCA 


TTACTTACTG 


AAATTGCATG 


ATGATATGAT 


AACCGACGAA 


ATGTTAATTA 


27960 


35 


ACTCGTTATG 


TAATGaTTAA 


TATaAAACAC 


CATTCGCAAC 


ATATGAGCGA 


TATATTCTAC 


28020., 


CCTAAAATAC 


ATCTTGTATC 


ATCGTTACAA 


TTGGTATATT 


TTTCAATGTA 


AATTACATAC 


28080 




ATCTTCGATA 


AATAGCACAC 


TACAAATCGT 


TAATCACTTT 


CTGTTGTTCA 


CATCTCATTG 


28140 


40 


CAAACTCAAT 


ArixrrixrrrA 


CAAAATATCC 


ATGAAGCAAG 


TTTATATTAA 


ACAAACAACT 


28200 




CGCATAAAAC 


AATTGTTATC 


CTTAAATTTT 


AACAAATTCT 


TAATAAATTT 


ATCTCTATTT 


28260 




TAATTACGAC 


CAAATTAATA 


GGTTTTCCAT 


ATAAAAAGAT 


GCATAAAATA 


AATATTTAAA 


28320 




TAAATTCAAT 


TTGTATTCAC 




CCCCuAAATA 


CACCAGCAAC 


AAGCATGCTA 


28380 




GGACCAATTG 


TTAAAACGAT 


AAACATATAC 


AGTCCCATTT 


GTAATGACGT 


TAAGAAAACA 


28440 




CCCAACACAA 


TCCCTAACCT 


AGCTAGTGTT 


TCTGAAAAAT 


GAATACCTAA 


TGCATTAACT 


28500 


SO 


GCACTATATG 


TTCCTCTTTT 


AGCTTTAGGA 


ATAATTTTAA 


AGOGTTGTTC 


TGAAACTATA 


28560 




GGCGAATAAA 


TAATTTCACC 


TACAGTCGCA 


ATTATCATAA 


AAACAACTAA 


TAAGCCAAAC 


28620 
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GCTTTTTTAA AATCTATTTT CAATACAACT TTCGAGATTG AATACGTGAG TAaAATGACG 
ACGACCGTAT TAATCATTAG CAAGATTGCT AACATCTTAG CACCTGTAAT ATCATATGAA 
CCTATACTTA TTGTTTCAAA CTGATCCTTT AGTCTAATAG CAATATATGA GGAGATTGAA 
AATTCACCCA TCATGATGAT ACTGAACCCC GAAATCAATA ACATATAATT ACGGTCTTTC 
AAAACTAATT TATAACTGCG AAATATATTC ATTATTTGTA ATTTTTGATA ACGACTTGCA 
TGCCTCTTGT CATCACTTTG CTTTACTTGA TTTCGGTCTT GAGGTAACCA AATATATAAA 
ATAAAGAGTA CAATTAAAAA TATACAAGCT GCTATTAAGA AAAGTAGTAA CATACTGTAG 
CCATACATCA AGCCACCTAA CAATGCCCCA ATAGCTACCG ATAAGTTTGT CATCCAATAG 
CTAATCTTGT AAATATAATG TTCCACGTCT TCGGTAATTG CATCCATAAT TAATGTGTCC 29220 
ATAACTGGAA ATTGTAATCC CCAAACGATT GTAAATATGG CATATGCAAC ACAAAAACCA 2928 0 
ATAATTTGCC ACAATTGATG TGACCCAAAT ACGCCCATGA ACACAAGCAT TATCACCATC 29340 
GTCGCTTGAT AAATAAGTAC TAGCAACTTT tTCGGAAATA TCTCAATAAG GTAACCAGAT 29400 
ATAATGGACA ATGGAAATTT nAGAACCACT AAACCAACAA GATATATACC GACAATTGAT 29460 
25 TGACTTAACA TATCTGTTAA ATATAGTGCT ATAAACGGTA TAAATGCTGT CGTAATAATT 29520 

AGCTGTAAAA nATTGCTAAT CAATCGTACT TTCAA 29555 
(2) INFORMATION FOR SEQ ID NO: 207; 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1539 base pairs 

(B) TYPE : nucleic acid 
CO STRANDEDNESS : double 
(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 207: 
AAAAAAAAAA AAAAAnGGTG AATCTTTAAT TAAACACTAA TATTGTAAAA GATGTTAAGT 6 0 

AAACGCTTAA TGACACTTAT TTTTTGAAAA TAATAGTAAT ATCATTTTGT TAAATGAAAG 120 
AATAAAGCTA TAATmATTAT AGAATAACTA TTTAAAGGAG ATTATAAACA TGCCAATTAT 180 
TACAGATGTT TACGCTCGCG AAGTCTTAGA CTCTCGTGGT AACCCAACTG TTGAAGTAGA 24 0 

AGTATTAACT GAAAGTGGCG CATTTGGTCG TGCATTAGTA CCATCAGGTG CTTCAACTGG 3 00 

TGAACACGAA GCTGTTGAAT TACGTGATGG AGACAAATCA CGTTATTTAG GTAAAGGTGT 3 60 

SO TACTAAAGCA GTTGAAAACG TTAATGAAAT CATCGCACCA GAAATTATTG AAGGTGAATT 



420 



TTCAGTATTA GATCAAGTAT CTATTGATAA AATGATGATC GCATTAGACG GTACTCCAAA 4 80 
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AGCTGACTTA 


TTAGGTCAAC 


CACTTTACAA 


ATATTTAGGT 


GGATTTAATG 


GTAAGCAGTT 


600 


ACCAGTACCA 


ATGATGAACA 


TCGTTAATGG 


TGGTTCTCAC 


TCAGATGCTC 


CAATTGCATT 


660 


CCAAGAATTC 


ATGATTTTAC 


CTGTAGGTGC 


TACAACGTTC 


AAAGAATCAT 


TACGTTGGGG 


720 


TACTGAAATT 


TTCCACAACT 


TAAAATCAAT 


TTTAAGCAAA 


CGTGGTTTAG 


AAACTGCAGT 


780 


AGGTGACGAA 


GGTGGTTTCG 


CTCCTAAATT 


TGAAGGTACT 


GAAGATGCTG 


TTGAAACAAT 


840 


TATCCAAGCA 


ATCGAAGCAG 


CTGGTTACAA 


ACCAGGTGAA 


GAAGTATTCT 


TAGGATTTGA 


900 


CTGTGCATCA 


TCAGAATTCT 


ATGAAAATGG 


TGTATATGAC 


TACAGTAAGT 


TCGAAGGCGA 


960 


ACACGGTGCA 


AAACGTACAG 


CTGCAGAACA 


AGTTGACTAC 


TTAGAACAAT 


TAGTAGACAA 


1020 


ATATCCTATC 


ATTACAATTG 


AAGACGGTAT 


GGACGAAAAC 


GACTGGGATG 


GTTGGAAACA 


1080 


ACTTACAGAA 


CGTATCGGTG 


ACCGTGTACA 


ATTAGTAGGT 


GACGATTTAT 


TCGTAACAAA 


1140 


CACTGAAATT 


TTAGCAAAAG 


GTATTGAAAA 


CGGAATTGGT 


AACTCAATCT 


TAATTAAAGT 


1200 


TAACCAAATC 


GGTACATTAA 


CTGAAACATT 


TGATGCAATC 


GAAATGGCTC 


AAAAAGCTGG 


1260 


TTACACAGCA 


GTAGTTTCTC 


ACCGTTCAGg 


aAACAGAAGA 


TACAACAATT 


GCTGATATTG 


1320 


CTGTTGCTAC 


AAACGCTGGT 


CAAATTAAAA 


CTGGTTCATT ATCACGTACT GACCgTATTG 


1380 


CTAAATACAA 


TCAATTATTA 


CGTATCGAgA 


TGAATTATTT 


GAAACTGCTA 


AATATGACGG 


1440 


TATCAAATCA 


TTCTATAACT 


TAGATAAATA 


ATTTTCTnTA 


TAATCAAATG 


CTGACATAAT 


1500 


TTTAGTTGAG 


GATTATTATG 


ACGGTATAAA 


TAAATAAAG 






1539 



(2) INFORMATION FOR SEQ ID NO: 208: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 846 base pairs 
35 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 208: 
CAATTTCTAT CTATCAATGA TGTGCATACT TCCAnTTAAA TTAAtCGAAA TGaATCAAGG 60 
T AT ATCATT C CTGCCTCTTT ATATAACaAC AAATAGTGAT TACAATATTT CGGTTATTAA 120 

45 

CACGAAAATT TTACAAGCAC CTATTTCATT TACATATATA TACAGCAAAA AAGAAAGCCC 180 
AGAAATATTG GTGTTTATTA AATCATTTAA AAAGTATATT GCCAATGAAC AATTATAATA 24 0 

50 AATTTCAAAT CTAAAAAACC AAGAATGCGA TTAATCATCA CATTCTTGGT TCAATTTTAT 300 
TCATGAATTT TTTCAACATT AAACGTTAAG TTATTGTCTG AATTTAAATT AACTTTAATC 360 

55 



949 



EP 0 786 519 A2 

CGTTGTACAA AACGTTTTAA TGGTCTTGCA CCGTATTGAG GTTCATAAGC TTCTTGACCT 
AGCCAAGCTT TAGCATCATC AGAAACTTCA ATTGAGATTC GTTGTTCTAA TAATCTTATA 
TTTAATTGCG TTAAGATTTT ATCTACAATC ATACTCATGT CATCAATAGA TAATGGTTTA 
AATAATACGA TATCATCCAT ACGATTCAAA ATTTCTGGTT TGAAATATGC ATTTAAACTT 
GTCATAACAG CTTTTTCTGT TGATTCTGTA ATTTCACCAG TCTCTTTTAC GTTTTCTAAT 
AAAACTTGAG ATCCAATATT ACTTGTCATA ATAATAATAG TATTTTTAAA ATCAACGCTA 
CGTCCTTTAG AATCAGTTAA ACGGCtTCAT CTAAAATTTG CAATAATACA TTAAAGACGT 
CAGTAT 

(2) INFORMATION FOR SEQ ID NO: 209: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1674 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 209: 
nTGGGAACAG TAAGCCAGTA TTTTTAGAAA GTTGCCATAC ATGAG CGTCG ATTTTTCCAA 
TATGGCTATG ACACTAGAAC AATGGGAATT TGGAGGAAAA GTAAATGATT AAACCTAAAA 
TAGCATTAAC CATTGCAGGT ACTGATcCaA CAGGTGGTGC CGGCGTAATG GCTGATTTAA 
AATCATTTCA TTCATGTGGT GTATATGGTA TGGGCGTCGT TACAAGTmTT GTTGCTCAAA 
ATACATTGGG CGTACAACAT ATTCATAATT TAAATCATCA ATGGGTAGAT GAACAACTTG 
ATAGTGTCTT CAATGATACC TTACCTCATG CTATTAAAAC GGGGATGATT GCTACAGCAG 
ATACTATGGA AACGATTCGT CATTATTTAA TGCAACATGA ATCTATTCCA TATGTAATt G 
ATCCTGTTAT GTTGG CG AAA rCggTGATTC ATaATGGwTA ATGACaCAAg CaAAACTTGC 
AGCATaCGTT ATTGC CATT A GCTGACGTAG TAACACCGAA TTTACCAGAA GCTGAAGAAA 
TAACGGGACT AACCATTGAT AGTGAAGAAA AAATTATGCA GGCTGGCCGC ATCTTTATTA 
ATGAGATTGG TAGTAAAGGT GTCATCATTA AAGGCGGTCA TTCAAATGAT ACTGATATAG 
CAAAAGATTA TTTATTTACT AACGAAGGTG TTCAAACATT TGAAAATGAA CGATTTAAAA 
CAAnACATAC GCATGGAACA GGGTGTACAT TTTCAGCAGT TATAACGGCA GAACTTGCAA 
AAGGTAGACC ATTATTTGAG GCTGTACACA AGGCTAAAAA GTTTATTTCA ATGAGTATAC 
AATATACGCC TGAAATCGGC CGTGGTAGAG GTCCAGTGAA TCATTTTGCA TATTTAAAGA 
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TGTTATACAA 


ACGATGTAGT 


TAAAAATTTT 


ACAGCGAATG 


GTTTATTAAG 


TATTGGTGCT 


1020 


AviCUU 1\j(_AA 


TGAGTGAAGC 


TCCCGAAGAA 


GCTGAAGAAT 


TTTACAAAGT 


TGCACAAG CG 


1080 


CTA 11 AATCA 


ATATCGGTAC 


TTTAACAGCA 


GAAAATGAAC 


AAGATATTAT 


TGCGATTGCT 


1140 


CAAACGGCAA 


ATGAGGCAGG 


CTT AC CT ATT 


GTATTTGACC 


CTGTAGCTGT 


TGGTGCTTCT 


1200 


ACATATCGAA 


ft ^^^^ft ft fwnn^m^^ 

AGCAATTTTG 


TAAATTATTA 


TTGAAATCAG 


CGAAAGTATC 


AGTAATTAAA 


1260 


GGCAATGCAT 


CTGAAATATT 


AGCGTTGATT 


GATGATACAG 


CAACTATGAA 


AGGTACAGAT 


1320 


AGTGATGCTA 


ATCTTGATGC 


GGTTGCAATA 


GCGAAAAAGG 


tTACGCAACA 


TATAAAACTG 


1380 


CAATAGTAAT 


CACAGGTAAA 


GAGGACGTTA 


TTGtTCmAGA 


TAATAAAGCC 


TTCGTATTAG 


1440 


CTAATGGATC 


TCCATTATTA GCACGAGTAA 


CTGGAGCTGG 


TTGTTTATTA 


GGAGGCGTTA 


1500 


TTGCTGGATT 


TTTATTTAGA 


GAAACAGAAC 


CAGACATAGA 


AGCGTTAATT 


GAAG CGGTAA 


1560 


GCgkATTTAA 


TATTGCTGCT 


GAGGTAGCTG 


CTGAAAATGA 


AAATTGTGGT 


GGTCCTGGTA 


1620 


CGTTTTCACC 


ATTGTTGCTT 


GATACGTTAT 


ATCATTTAAA 


TGAAACAACC 


TATC 


1674 



(2) INFORMATION FOR SEQ ID NO: 210: 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2232 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 210: 
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ATGAGTTGCC 


GATGAATTTA 


GCACCACCAA 


CGATTGCnTT 


TGATACTGTG 


TCCCAACCAG 


60 


CTTGTTTAGC 


ATATTTAATA 


CCTTCACGTA 


AAGGATCGTT 


ATCATATGCA 


GCAATACCAA 


120 


ATACGTTATG 


GTATTTCGTG 


TTTGAGTTAG 


TTACAACTTT 


GTnTTGCACT 


ACATCTGCAC 


180 


CTTTCGCTAA 


TTGAGAAGTA 


CCGTTACCTG 


TTTCTAATAG 


GGCATGTGAG 


ATAAGATAAA 


240 


CTTCATTAAT 


GCCATACATT 


TGAGCAGCTT 


TGTTAAATGC 


AGCAC CTTGG 


TTTTCTAATA 


300 


CACCTTTACC 


TTTTAAGAAT 


TGATTAATTT 


TATCAATAGA 


AATATTTTGT 


GGTTGGTCTA 


360 


AGCGTAAGAA 


TTGATATTTT 


AATGCTGGAT 


CTTGAGCTAA 


ACGCTTCGTA 


TCCATTGCAT 


420 


GCTTAACATC 


ATTAAATTTA 


GCATCTGTCC 


ACTTACCTGG 


TACACGTTGT 


ACTTGTGGTT 


480 


TATATTGTAA 


ACCAGCTTGT 


ATTTGAGCAA 


CTTGGTTTAA 


TGTCATACCT 


GTTTGATTAT 


540 


ACTTAATTAA 


TTCTTTAGCT 


AAATCAGTTG 


ATTTAATCCA 


TGCtAATTTA 


CCGTTAGATA 


600 


ATTTACCATA 


GTACCAAGTT 


TGTCCATTAA 


TGACTTCTTC 


TTTAACAACT 


GCGAATGGTT 


660 
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AACCATTACC ATTTTTAATT ACATAAGTGT AGTTATAATC TTTGGcAGCT GATGTAGTTG 780 

GTTTCACAG C AGTTGGTGCA GTTAAATCTT TTGCATTTAC CCAACCAGTG CGGTTATTAA 840 

TAGTACCGTA TAAATAAACA TCTTTGCCTA CAGATACTTG TTTCGTTGCA TTAAATGTAC 900 

CTTGAGCAAT GTTATTG CCT GTTAAAATGA CTTGGTTTTT AGTACCCCAA GGAACCATTG 960 

ATAAG CCGTT ATTTGATTTA TTAACAGTAT ATTTTTGAGT CGTTTTAACT TCTTTGCCTA 1020 

AGTTTTGAAC ATTTAAGTCT TTTACATTGA ACCAACCTAA TGGGATGTTA TGGCTTGTAT 1080 

TGTTTAATAA TACATACGTT TCATTACCAT GAGCACGCTC TTTTGTTACA TAGAACGTAC 114 0 

GGTCTGCATA TTTCGCACCG TTTTTCGCTG TTTTTTCATA AACAGAAGCA CGAATACCAG 1200 

TGTTGTTTGG TTTAACTTGA GCAATCTTGC TAACTGTTTG AGTCGTTTGT GGTTTAGTAA 1260 

CAGTATAAGC TTTTACAGCT GTTTTTGGTT GTGCTACTGC TTTTTTAGGT GCAGCAGGTA 1320 

CAGCTAAATA TGCTTTACTT ACCCAACCAG ATTTACCATT TACAGTTCCA AATAAATAGA 13 80 

TAGATTTATC AATTTGTTGT TGCTTAGTCG CTTTAAAAGT. TTGGTTACCT GTACCAGAAA 144 0 

25 CTGCACCAGC TTCTTGTTTA TAAGTGCCCC AAGGTACTGA ATATAATTTA GTGCCTGGgT 1500 

TTACTGTATA TGTTTGCATT ACATTTACAG GTGATTTTGC ATtGtTATAA ATACGTCACC 1560 

TTGTTTAACC CAACCAATTA AAGTTGGACT ATTGTAATCT TTAACTAAGT AGAATTTGTT 1620 

30 TCCACCTAAA CTTGCTTCTT TTGTTACAGC AAATGTTTTT TGAACTTCTT TCGTTGGCTT 16 80 

ACCAGTTTTG TCATAAACTG TAGTGAATAA GCCATTGTTT TTAGCATTAA TTTGAGCAAC 174 0 

ACCGTTTAAT GATGAAACTG TTAATTTATT ATTTGTTGTA GGTGTTGATG GCTTAGGTGT 1800 

TGGTGTAGGC GTAGGTTTAG CAGTATCAAC TAAATATGCT TTACTTACCC AACCAGATTT 1860 

ACCATTCACA GAG CCATATA AATAAATTGA TTTATCAATT TGTTGTTGCT TTGAAGCCTT 1920 

AAATGTTTGG TTTCCAGAGC CAGACACACT ACCAGCAACT TGTTTAGATG TACCCCAAGG 1980 

TACTGTATAA AGTTTCGTAC CAGGTTTGAT TGAATATGAT TGATTTACAT TTACAGGTGA 2040 

TTTAGCTGTG TTGTAAACCA CATCGCCTTC TTTAACCCAA CCAAATTTAT TACCAGAATT 2100 

45 GTAATCTTGA ACAAGATAGA ATTTTTGATT ACCTAATGTA GCTGTTTTAG ATACAGCAAA 216 0 

TGTTTTTTGA ACTTCATTAG TTGCTTTACC AGTTTTGTCG TATACAGTAG TATATAAACC 2220 

ACTATTTGTT GG 2232 

so 

(2) INFORMATION FOR SEQ ID NO: 211: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 2082 base pairs 
55 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 211: 

GATTTAAATA AAATTAATGG ATATCGTGAT CGTACGATGT TAGAACTTCT GTACGCAACG 60 

GGAATGCGTG TATCTGAATT GATACATTTA GAGTTAGAAA ACGTGAACTT AATAATGGGA 120 

TTTGTACGCG TATTTGGTAA AGGCGATAAA GAAAGAATTG TACCATTAGG CGACGCAGTC 180 

ATTGAGTACT TAACTACTTA TATTGAAACG ATTAGACCGC AACTTTTAAA AAAGACTGTT 24 0 

ACTGAAGTCT TATTTTTAAA TATGCATGGT AAACCTTTAT CACG ACAAG C AATATGGAAA 300 

ATGATTAAAC AAAATGGTGT AAAGGCAAAC ATTAAAAAGA CGTTAACGCC ACATACGTTA 360 

15 CGCCACTCTT TTGCGACACA TTTATTGGAA AATGGCGCAG ATTTAAGAGC AGTGCAAGAG 420 

ATGTtAGGtC ACTCTGaCmT ATCT ACT AC C CmaCTCTATA CmCATGTTTC GrAATCTCAA 4 80 

ATTAGAAAAA TGTATAACCA ATTTCATCCT AG AG CAT AAA GTGAACAATA ACTCAAAAGT 54 0 

CACAATACAC ATGACTAAAA ATGTCTGTGC TATTGTGGCT TTTTTAAATT GGTTGATTAA 600 

TTACG TCT AT GTTTTCTTAA TTGAATCGCT TCTTCTTTTG CTG CAATCAC TTCTGAACGA 660 

TCACGGCGCA TGTGATGGTC TACAATAAAA GGATCTGTTG CTGTTTCCTG ATTATAATCA 720 

TAGTCTGGAT AGTTGGCCTT GATGATGCGT TCAAAGACTG GAGTTATTGG TAATATAACA 780 

GATGAAAAAG GCTTTGCTGC ATTCAATTTT GCAATCTGTT GCTCAATTAA CAACTGATAA 84 0 

30 TCATTTAAAT TAAGGTATAA CGCATCTCTA TCTTTAGCAT TTTGTATTAT TTCTTTAGAT 900 

TTATTAAAAG ACTTATAGGC GCCTTTTAAA TTATTGCGGC GATAATGGTA ACAAGCAGTT 960 

GCAAACAAGA TTAAACTAAC AACTGCATCT TGCTTACTGT AGTTATTTTC AGCTTTCCAT 1020 

GCATCTTCTA AAATGTCATG ACATAGGAAA TAATGTTGCT TAGTATGAAA TTGATAATAG 1080 

AAACTTATCA GTGCCTGTTG CATTTTGTTA TCACCCCAAT TTAAAAGTAA GTTATTTTCA 114 0 

TGCTATAATA TTTTAGAGAA TTATGCACAT ATGACGCAAT A CG AGGT AG A TATTATGTAT 1200 

GAAGTTAAAT TAGATGCTTT CAATGGACCA TTAGATTTAT TGCTGCATCT TATCCAAAAA 1260 

TTTGAAATAG ATATTTATGA TATTCCTATG CAAGCATTAA CAGAGCAGTA TATGCAGTAC 13 20 

45 GTTCATGCAA TGAAACAGCT TGAAATTAAT ATTGCAAGTG AATACCTAGT ATTAGCGTCA 13 80 

GAACTCTTAA TGATTAAAAG TAAGATGCTA TTACCACAAT CAACATCAGA TATGGATGTT 144 0 

GATGATGACC CACGGGAAGA TTTAGTtGGG CGTTTAATAG rATATCaAAA TTATArAGAA 1500 

so 

TATACTGCtA TTTTAAATGA CATGAAAGAA GAAAGAGATT TTTATTTTAC CAAAAAGACC 1560 

GACAGATTTA TCtCATTTGG AAA cAGATG A ATCyTGGGAT CCaAATCATA CGATTGATTT 1620 
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ATCTGTTGAA ATCCGAAAAG 


AGACATTTAC 


CATTCAACAA 


GCTACAGAAC 


AAGTGACATC 


1740 




GAGATTGAAA 


GATAAAGATC 


ATTTTAACTT 


CTTTAGTCTG 


TTTACGTTTT 


CTGAGCCAAT 


1800 


5 


TGAACAAGTA 


GTCACTCACT 


TTTTAGCTAT 


TTTAGAGATG 


TCAAAAGCAG 


GAATAATTAA 


1860 




TATTGAGCAA 


CAACGTAATT 


TTGAAGATAT 


TAACATTATT 


AGAGGAGTGA ACTACCATTT 


1920 


10 


TGGATAATCA 


TGGTATATTA 


GAGTCGCTTT 


TATTTACAGC 


TGGCGATGAA 


GGTTTAGATG 


1980 




AAAAACAACT 


ATTAGAAATA 


TTAGATATGT 


CGAAAGACCA 


ACTCGTTGAA 


TTAATTGAAA 


2040 




ATT ATT CAT C 


ACATGGATTA 


ATGATACAAC 


GATTTGGAAT 


GA 




2082 


15 


(2) INFORMATION FOR SEQ ID NO: 212: 








20 


(i) SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 4219 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 212: 








TCTATTCTCG 


TTCTTCCAAG 


ACCCTGaATT 


AGAAGTTAAG 


AAAATCGAAG 


AAGATGAGAA 


60 




AGAATCTATT 


AAAAAAGCTC 


AAAAAGGTAT 


TTATAAAGAC 


CCTAGAGACA 


TCAATGATGA 


120 


30 


CGAACAAGAT 


GATGATACAA 


AAGATACTGT 


TGATAAAAAG 


GAATGATTGT 


AATTG LCTAA 


180 




CAAAAACACT 


CAAGAATATT 


GGGAAGAACG 


CGGACGCAAA 


GCAATCGAGA 


A I bAGTTGAA 


240 




GCGTGATAAA 


ACTAAAGCTG 


AAGAAATAGA 


ACGTATATTG 


AATATGATGA 




300 


35 


TGAAAAAGAG 


ATCaATGCGT 


TTATTGTCAA 


GTACGGAGAT 


TTTGCAGGCG 


IT* fi /"** TV 1 fl ' TV TV 


360 




AGAAGCACAA 


AAGATTATTG 


ATGAGTTCGA 


TGTAAAAGCG 


TTTCAAGAAG 


AAuLAAAAAu 


420 


40 


ATTGdTCGAA AACAAGGAGT TTAGCGATAG 


AGCAAATGAA 


GAATTAAAGA 


JA/Tr*7A T»Jv 

A&> 1 AX AACAC 


480 


GAAAATGTAT 


GTATCTAGAG 


AACAGATGTT 


AAAGATTCAA 


ATAGAATTCT 


T AATTG CTT A 


540 




TGCAACAGCT 


CAAACAGAAT 


TATCGATGAG 


GGAATATTTC 


GAATCAACAG 


CTTATCGTGT 


600 


45 


GTTCAGTGAT 


CAAGCGGGTA 


TTTTAGGTGA 


AGGTGTACAA 


GTAGCTAAAG 


AAGTTATAGA 


660 




TACAATCGTT 


GATACACAAT 


TTCATGGTGT 


CGTTTGGTCA 


GAGCGATTAT 


GGACTAATAC 


720 




CGAAGCAATG 


AAACAAGAAG 


TAGAAGAAAT 


AATTGCTAAT 


GTAGTTATTA 


GAGGTCGACA 


"7 ft f> 


SO 


TCCTAATGAA 


TATGTTAAAG 


ATATGCGCAA 


CACTTAAATA 


AATTCGAAGG 


CACAGCACGA 


840 




CAAAAGACCG 


CAGCAATTAA 


ATCATTGCTT 


TATACGGAAT 


CGGCACGTGT 


TCACGCACAA 


900 


£S 


TCAAGCATTG 


ACAG CATGAA 


AGAAATTTCA 


CCGGAAGgAT 


ATTATATGTA 


TATTGCAAAA 


960 
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GACGCTAAAA TTGGTGTTAA TTTCTATCCT ATGCATATCA ATTGTCGTTC AGATTGCGCT 1080 

TTACTACCTA AATCTATGTG GCCGAAAAAA CCAAGCAAGA AACGAAAAAC AAAATACTTC 1140 

GGAGGGAAAG TGAAAAGCGG TGATTGATTT AAAAGTGAAG TTTTTTAAAG GCAAGTTAGT 12 00 

TTTGTATGAC AGTAAATTAA ATGTTTGGAG GATACTAATA TGAGTAATAC TGACAAATAC 1260 

CTTAGAGACA TAGCAAGAGA ATTAAAAGGT ATACGTAAAG AGTTACAAAA GCGAAACGAA 13 20 

ACAGTTATTA TTGATGCAAA CTTAGACAGT TTAAGGTCGG CAGTATTAGC CGATAAAGAA 13 80 

AAATCGAAAT ATAATGAACC TCTCTTTTAA TAGCTAGCAC TTAATTGTGT TGGCTATTTT 144 0 

TTATGTCCAA AACGTGCTGA TGACATAAAA AGCACGCATG GAAAAACAGT CGACAGACTA 1500 

TAAATGGAGG TATATCTCAT GGAAGAAAAT AAACTTAAGT TTAATTTGCA aTTTTTTGCA 1560 

GACCAATCAG ATGATCCGGA CGAACCAGGC GGAGATGGTA AAAAAGGAAA TCCTGATAAG 1620 

20 AAAGAAAATG ACGAAGGTAC TGAAATAACT TTCACGCCAG AGCAACAAAA GAAAGTTGAT 1680 

GAAATACTTG AACGTCGTGT AGCCCACGAA AAGAAAAAAG CTGATGAGTA TGCAAAAGAA 174 0 

AAAGCAGCAG AAG CTGCTAA AGAAGCTGCT AAATTAGCGA AAATGAACAA GGATCAAAAA 1800 

GATGAATATG AACG CG AACA AATGGAAAAA GAACTGGAAC AATTACGTTC AGAAAAACAA 186 0 

TTAAACGAAA TGCGTTCAGA AGCACGAAAA ATGTTGAGTG AAGCGGaAGT TGATTCATCA 192 0 

GATGrGGTTG TCAATTTAGT TGTAACAGAT ACTGCTGAAC AAACTAAATT GAATGTTGAA 198 0 

GCTTTTTCTA ATGCAGTAAA AAAAGCGGTT AATGAAGCGG TTAAGGTTAA CGCTAGACAA 204 0 

TCGCCATTGA CTGGTGGAGA TTCATTTAAT CACTCGACTA AAAATAAACC GCAAAACTTA 2100 

35 GCTGAAATAG CTAGACAAAA AaGAATTATT AAAAATTAAC GGAGGCATTT AAATGGAACA 2160 

AACACAAAAA TTAAAATTAA ATTTGCAACA TTTTGCAAGT AACAATGTTA AACCACAAGT 2220 

ATTTAACCCT GACAATGTAA TGATGCATGA AAAGAAAGAT GGCACGTTGT TAAACGACTT 22 80 

TACAACACCT ATCTTACAAG AGGTTATGGA AAACTCTAAA ATCATGCAAT TAGGTAAGTA 234 0 

CGAACCAATG GAAGGTACTG AGAAGAAGTT TACTTTTTGG GCTGATAAAC CAGGTGCTTA 24 00 

CTGGGTAGGT GAAGGTCAAA AAATCGAAAC GTCTAAGGCT ACTTGGGTTA ATGCTACAAT 24 60 

GAGAGCGTTT AAATTAGGGG TTATCTTACC AGTAACAAAA GAATTCTTGA ATTACACTTA 2520 

TTCACAATTC TTTGAAGAAA TGAAACCTAT GATTGCTGAA GCTTTCTATA AAAAGTTTGA 2 580 

50 CGAGGCAGGT ATTTTGAATC AAGGTAACAA TCCGTTCGGT AAATCAATTG CACAATCAAT 264 0 

TGAAAAAACT AATAAGGTTA TTAAAGGTGA CTTCACACAA GATAACATTA TTGATTTAGA 2700 

GGCATTGCTT GAAGATGACG AATTAGAAGC AAATGCATTT ATCTCAAAAA CACAAAACAG 27 60 
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w 



15 



20 



25 



30 



35 



40 



45 



50 



TGATTCGTTA 


GACGGTCTAC 


CTGTGGTTAA 


CCTTAAATCA 


AGCAACTTAA 


AACGTGGTGA 


28 80 


ATTAATCACT 


GGTGACTTCG 


ACAAATTGAT 


TTATGGTATC 


CCTCAATTAA 


TCGAATACAA 




AATCGATGAA 


ACTGCACAAT 


TATCTACAGT 


TAAAAACGAA 


GATGGCACAC 


CTGTAAACTT 


3 oon 

■J u v y 


GTTTGAACAA 


GACATGGTGG 


CATTACGTGC 


AACTATGCAT 


GTAGCATTGC 


AT ATTG CTGA 


3060 


TGATAAAGCG 


TTTGCTAAGT 


TAGTTCCTGC 


TGACAAAAGA 


ACAGATTCAG 


TTCCAGGAGA 


3120 


AGTTTAATAA 


ATAATTAGGA 


GTGGTAACAT 


GCCCGAAATC 


ATTGGAATTG 


TTAAAGTAGA 


3180 


TTTTACAGAT 


TTAGAAGATA 


ACAGACATGT 


CTATATGAAA 


GGGCATGTCT 


ACCCTCGTAA 


3240 


AGGTTATAAT 


CCTACAGATG 


AACGTATCAA 


AGCTTTAGCT 


AGTGTTGAAA 


ATAAACGCAA 


3300 


CAAACAAATG 


ATTTACATTG 


TAAATGACAA 


ATTAACCAAA 


AAAGAACTTG 


TCGAAATAGC 


3360 


AAGTGTTGCT 


GGCTTACAAG 


TTGATGAAAA 


ACAAACAAAA 


GCTGAAATTA 


TCAATGCTTT 


3420 


TGAGTCACTA 


GAGTAGGTGG 


TTATATGACT 


ACGCTAGCTG 


ATGTAAAAAA 


ACGTATTGGT 


3480 


CTTAAAGATG 


AAAAGCAAGA 


TGAACAATTA 


GAAGAAATCA 


TAAAAAGTTG 


TGAAAGCCAG 


3540 


TTGTTATCAA 


TGTTACCTAT 


TGAAGTTGAA 


CAAATACCGG 


AAAGgTTTAG 


TTACATGATT 


3600 


AAAGAAGTTG 


CAGTTAAACG 


CTACAACAGG 


ATTGGTG CTG 


AAG t ATGACA 


TCAGAAGCGG 


3660 


TTGACGGACG 


TAGCAATG CG 


TATGAATTGA 


ACGATTtCAA 


GGAGTATGAA 


GCTATTATTG 


3720 


ATAATTACTT 


TAATGCTAGA 


ACGAGAACTA 


AAAAAGGAAG 


GGCTGTGTTC 


TTTTGAGATA 


3780 


TGAAGATAGA 


gttatttttc 


AATTAGAACA 


AGTAGCAACT 


TACAATCCTA 


AAACTAGCAA 


3840 


AAAAGAAAAC 


ACACTAATCA 


CTTATGATGC 


GATACCATGC 


AATATTAACC 


CCATTTCTAG 


3900 


AGCAAGAAAG 


CAACTTGAAT 


TTGGTGATGT 


AAAAAACGAT 


GTAAGTGTTC 


TGAGGATAAA 


3960 


AGAATCAATA 


TCTTACC CTG 


TTAGCCACGT 


GTTGGTTAAT 


GGCATTCGCT 


ACAAGATAGT 


4020 


TGATACAAGG 


ATATACAGAC 


ACGAAACGTC 


ATATTATATC 


GAAGAGGTCA 


ATTGATGAAT 


4080 


ATAGATGGAT 


TAGACGCACT 


GTTAAACCAA 


TTTCACGATA 


TGAAAACCAA 


CATTGATGAT 


414 0 


GATGTAGATG 


ATATTTTACA 


GGAAAACGCC 


AAAGAATATG 


TAGTACGAGC 


TAAATTGAAA 


4200 


GCTAGAGAAG 


TAATGAATA 










4219 


(2) INFORMATION FOR SEQ ID NO: 213: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1999 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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GCTTACAAGT 
yC t TTaACTA 
TyCTTTATkA 
ATGCTGATAT 
GACCTTGATG 
TCATTAAATG 
AAATATACAC 
AATGGTATTT 
TTATTCGGTG 
AACATTTCTG 
TTAACAGTAT 
ATTGTTCAAT 
TATTATTTAT 
CATTATTTCA 
CGTGCAATAC 
CGCGAAGTCC 
TAAATTATTT 
TGATGATTAC 
TATTTCATGG 
TGCGTCTGGT 
ATTGTATGTA 
TTTAAAACGA 
TTCGTCATTt 
GCGTTGTTCT 
ATATTTTAAC 
TTACCAAAAT 
ATATTCAATT 
TTTATTTATG 
CGATACTTGT 



ATATTCATAA 
CAACGGGGTC 
AAAAGTTATT 
TACTTTGTTT 
CCTTACCGTC 
ATAGTGGGTC 
TAGGTTTTGG 
TACTTGTTGC 
CATTATTTAT 
GGAAAAATGT 
CATTTAATAA 
ATGAAAAGAT 
CAAGGGCTAT 
CGTGCATTTG 
TTTTTGATGA 
GTTAACGACA 
TTAG CGTTAA 
TATCTTATTT 
TTTTATGCTG 
ATTGTATTAA 
TTTACTATTG 
TACATTAGCT 
AGCATACTTA 
TGGTTTAGTA 
GGTCGCAATC 
GTCTATCCAG 
GATATTAaCA 
GTTCtTTGGT 
ATTAATCATT 



TTACATATTC 
TAAGACTGCG 
TAGTAGAAAT 
TACCTTTTAT 
ATTAGATCGA 
TGAG CGAAGT 
TGTCGGATTA 
CCATAATACA 
CATATTTATG 
AACAGCAATT 
CTCAAGATAT 
GGAAAGGGAT 
ACCAATTGAT 
GTCCCAGTGG 
TTGCAAGTGT 
AACGGCAATT 
CAGTTTTTGC 
TCCTACTACA 
GAACTGAAAA 
GTGTAGTTGT 
CTATTGTGAC 
TTGTTTCGGT 
TTACCAAATG 
GGTACATACC 
ATAATGATTA 
CAATCACATA 
ATACCTATGG 
GAGGAATTCG 
CCTTTAAATA 



AAGGTCCTTG 
TTTATCATAT 
GCGGTAAGTG 
AATATCAACT 
ATGGCGTCTA 
GTTGTATGGA 
GTGGATTATG 
TATTTGCAGA 
CTTTATTTAC 
GTTGTAATGT 
GTCGCTTTTA 
CGTAATGAAG 
TAGAACGATG 
TGTGGGTATT 
TGGCGTTCAG 
GTCACAGCAG 
GATGTATATG 
AGGAATCTAT 
GTTTAAAATT 
TATTTTTGTC 
GGTATTAAAC 
TAATTGGATA 
GACAGCTCAA 
AACAAGTTGG 
ATACATTTGA 
GTTTAACTAA 
TCTTTgGTTT 
CATCAACTGT 
tGTTGaTAAg 



CATGTGGTAT 
TAATCGTCTT 
TTGTGAGTAT 
ACTATTTATT 
TTTTTGAAGA 
TAAATGCCAT 
TACATATTGG 
TCTTTGCGGA 
TGTTTGAATT 
TGACGATGCT 
TTTTAGGAAT 
AGTGATTCAC 
ACACCACTGA 
GTTTCATTTT 
TTATATTTTA 
TTTTGGGATA 
GTCGTAATTA 
ATTATAGGTG 
CCTAGCCTCA 
AAAGATCAAT 
CAATTACCTT 
CACGTCTGGC 
CTTATATACT 
TATCTTTTCT 
TCTTGTAATG 
AACGTTAGCT 
AATTGCaATT 
CCCATTGATG 
CaGGCAATAT 



TTTGCTATGG 
AGCCATTtAT 
GTCAGTGATT 
CCAATTAAGC 
GGGCTTTGCA 
TTCAGTAATT 
CTCGCAAATT 
ATGGGGCATT 
ATTTAGATTT 
GATTTACTTT 
TATCGTCTTT 
TAAAAGAAAA 
TTACAATACC 
CTTTCAATAT 
ATAGAGTTAT 
TCTTTGTCAG 
CTATATTTAT 
CAGCACTCGA 
GTAATATTGT 
CAGATTTATC 
TGTTTATCTA 
AATTGTTTCG 
AGTATTTCTT 
AACGCATTTA 
ATTCCGCGTA 
AATAATATGA 
ATGCCATCAT 
ACCATTTTAG 
TTAtTAAtAG 
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TATGTAyTAT TTTGATATAT TTTTATGGAA TTTACGGTGC TGCTATTGCG CGTTTAATTA i860 

CAGAGTTTTT CTTGCTCATT TGGCGATTTA TTGATATTAC TAAAATCAAT GTGAAGTTGA 1920 

ATATTGTAAG TACGATTCAA TGTGTCATTG CTGCTGTTAT GATGTTTATT GTGCTTGGTG 1980 



TGGTCAATCA TTATTTGCC 1999 
(2) INFORMATION FOR SEQ ID NO: 214: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 776 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
1S (D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 214: 

20 TCATTATTAA GACTATTATA TATAATGAAT TTTAACTGGT TTATTAAACG AGAACGTCGG 60 

GAATTAAGTA ACTACAATAA AAATAAGATA TGACAATAAG GAGACTACAC GCGTGATCAT 120 

TGCCATAATT ATATTGATAT TTATTTCGTT TTTCTTTTCA GGAAGCGAGA CGGCATTAAC 180 

25 

GGCTGCCAAT AAAACAAAAT TTAAAACTGA AGCTGACAAA GGTGATAAAA AAGCAAAAGG 240 

CATTGTAAAG TTACTTGAAA AACCAAGTGA GTTTATTACA ACGATTCTAA TTGGGAATAA 300 

TGTCGCGAAT ATTTTATTAC CAACACTTGT TACAATTATG GCTTTACGTT GGGGGATTAG 3 60 

30 

CGTTGGTATT GCATCAGCTG TTTTAACAGT TGTTATCATT TTGATCTCCG AAGTGATTCC 420 

CAAGTCTGTC GCTGCAACAT TTCCAGATAA AATAACAAGG CTTGTATATC CAATTATTAA 480 

35 TATTTGTGTC ATTGTGTTCC GTCCTATCAC ATTACTTTTA AATAAGTTGA CGGACAGTAT 54 0 

TAATCGAAGT TTATCTAAGG GCCAACCTCA AGAACATCAA TTTTCAAAAG AAGAATTTAA 600 

AACAATGTTA GCAATTGCTG GACATGAAGG TGCTTTAAAT GAAATTGAGA CGAGTAGGTT 660 

40 GGAAGGTGTC ATTAATTTTG AAAATTTAAA AGTAAAAGAT GTAGATACAA CACCTAGAAT 720 

TAATGTGACG GCATTTGCTT CAAATGCGaC ATACGAAGAA GTTTATGAAA CGGTTATGAA 780 

TAAGCCATAC ACTAGATATC CAGTGTACGA GGGAGATATT GATAACATTA TTGGGGTGTT 84 0 

45 

TCATTCTAAA TATCTGTTGG CTTGGAGTAA TAAAAAAGAA AATCAAATTA CAAACTATTC 900 

AGCTAAGCCA TTATTTGTGA ATGAACACAA TAAAGCTGAA TGGGTATTAC GTAAGATGAC 960 

so TATTTCTAGA AAACATTTAG CAATTGTGTT GGACGAATTT GGTGGTACTG AAGCGATAGT 1020 

GTCACATGAA GACTTAATTG AAGAATTATT AGGTATGGAA ATTGAAGATG AGATGGATAA 1080 

AAAGGAAAAA GAAAAACTTT CTCAACAGCA AATTCAATTT CAACAACGGA AAAATCGCAA 1140 
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GTATTGAATA 


TCCAATTATA 


CAAGCAGGTA 


TGGCAGGAAG 


TACGACACCG 


AAATTAGTTG 


1260 




CAT CAGTAAG 


TAACAGTGGT 


GGGTTAGGCA 


CAATAGGCGC 


AGGTTACTTT 


AATACGCAGC 


1320 


5 


AATTGGAAGA 


TGAAATAGAT 


TATGTACGCC 


AATTAACGTC 


AAATTCTTTT 


GGCGTAAATG 


1380 




TCTTTGTACC 


AAGTCAACAA 


TCATATACCA 


GTAGTCAAAT 


TGAAAATATG 


AATGCATGGT 


1440 


10 


TAAAACCTTA 


TCGACGCGCA 


TTACATTTAG 


AAGAGCCGGT 


TGTAAAAATT 


ACCGAAGAAC 


1500 


AACAATTTAA 


GTGTCATATT 


GATACGATAA 


TTAAAAAGCA 


AGTGCCTGTA 


TGTTGTTTTA 


1560 




cttttggaat 


TCCAAG CGAA 


CAGATTATAA 


GCAGGTTGAA 


AGCAGCGAAT 


GTCAAACTTA 


1620 


IS 


TAGGTACAGC 


AACAAGTGTT 


GATGAAGCTA 


TTGCGAATGA 


AAAAGCGGGT 


ATGGATGCTA 


1680 




TCGTTGCTCA 


AGGTAGTGAA 


GCAGGTGGAC 


ATCGTGGTTC 


ATTTTTAAAA 


CCTAAAAATC 


1740 




AATTACCTAT 


GGTTGGAACA 


ATATCTTTAG 


TGCCACAAAT 


TGTAGATGTC 


GTTTCAATTC 


1800 


20 


CGGTCATTGC 


CGCTGGTGGA 


ATTATGGATG 


GTAGAGGAGT 


TTTGGCAAGT 


ATTGTCTTAG 


1860 




GTGCAGAAGG 


GGTACAAATG 


GGCACCGCAT 


TTTTAACATC 


ACAAGACAGT 


AATGCATCAG 


1920 




AACTACTGCG 


AGATGCAATT 


ATAAATAGTA 


AAGAAACAGA 


TACAGTCATT 
• 


ACAAAAGCGT 


1980 


25 


TTAGTGGAAA 


GCTTGCACGC 


GGTATCAACA 


ATAGGTTTAT 


CGAAGAAATG 


TCCCAATACG 


2040 




AAGGCGATAT 


CCCAGATTAT 


CCAATACAAA 


ATGAG CTAAC 


AAGTAGGATA 


AGAAAAGCCG 


2100 


30 


CAGCAAACAT 


CGGCGACAAA 


GAGTTAATAC 


ATATGTGGAG 


TGGACAAAGC 


CCGCGACTAG 


2160 


CAACAACGCA 


TCCCGCCAAC 


ACCATCATGT 


CCAATATAAT 


CAATCAAATT 


AATCAAATCA 


2220 




TGCAATATAA 


ATAATCGACC 


GCAATCCACA 


AAAGCACAAG 


CACCCCCAAA 


CATTATTTTA 


2280 


35 


GTGCTTGCCA 


TTTTTGTGGA 


TTGCGTTTCT 


ATTTTACCAA 


TTTAATCAAA 


CGAAAACATC 


2340 




AAGCTGAAGA 


TCGCCGAAAG 


ATTTTAATCA 


AGCAAAAACA 


TCAAACTAAA 


GTTCGCTGAA 


2400 




ATGATTATGA 


TAAAAGTTAT 


ATGGTATGAT 


GACATTGGTG 


ATATATATGA 


TAAACATCGG 


2460 


40 


ATTAACAGGT 


TGGGGTGATC 


ACTATTCATT 


ATATGAAGAT 


TTAGAACGCC 


AAACCGATAA 


2520 




ACTTAAAACA 


TATGCTGGAC 


ATTTTCCGGT 


TGTCGAATTA 


GATGCGACAT 


ACTATGCGAT 


2580 


45 


ACAACCGGAA 


AGAAATATAT 


TGAAATGGAT 


AAAAGAAACG 


CCTGATACAT 


TTGAATTTGT 


2640 


GGTCAAAATT 


CATCAAGCAC 


TCACATTGCA 


TGCAGACTAC 


AAAACATTTG 


CAGATACAAG 


2700 




GCAAGAACTA 


TTTGATCAAT 


TTAAGAATAT 


GTTAGAGCCC 


TTACATACAC 


AGAAAAAATT 


2760 


SO 


AGCAATGGTA 


TTGGTTCAAT 


TTCCGCCATG 


GTTTGACTGC 


AATGCACAAA 


ATATCAAATA 


2820 




TATTTTGTAT 


GTAAGACAGC 


AATTACAAGC 


ATTTCCAATG 


TGTGTAGAAT 


TTAGGCATCA 


2880 




ATCATGGTTT 


AGTGATGCAT 


TTAAAGAACA 


AACATTGGCA 


TTTTTAACAG 


AACATCAAAT 


2940 
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3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
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AATCACAAAT GAAATTGCGT TTGTACGTTA TCATGGACGT AATCATTACG GTTGGACTAa" 
GAAAGATATG TCAGATCAAG AATGGCGCGA TGTACGCTAT TTATATGATT ATAATGAGCA 
5 AGAATTAATA GACTTGGCAC AAAAGGCACA AATATTAGCA CAAAAAGCTA AGAAAGTTTA 

CGTCATATTT AACAATAATT CTGGTGGTCA TGCAGCAAAT AATGCCAAAA CATATCAGCG 
ATTATTGAAT ATAGAATATG AAGGGTTAGC ACCACAACAA TTAAAATTAT TTTAAGAGGC 
GACGACTATG TTATTAACAA TTACATTATT AGTTTTAATC GGAGGTTTGT CAGCGATTAT 
AGGGTCTATC GTAGGCATTG GAGG CGGTAT TATTATCGTT CCAACAATGG TTTACCTCGG 
;s TGTTGAACAT GGATTACTAC ATAATATTAC AACACAAGTA GCGATAGGGA CGTCTTCAGT 

CATTCTAATT GTGACAGGAC TTTCTTCATC ACTTGGATAT TTAAAAACAA AACAAGTTGA 3540 

TATTAAAAAT GGTTCCATCT TTTTATTTGG ACTATTACCA GGTTCATTGC TTGGGTCCTT 3600 

CATTAGTAGA TATTTAACAT TTGAGTCATT TAATTTATAT TTTGGTATCT TTTTAATTTT 3660 

CGTAGCCATT TTATTAATGG TAAGAAATAA GATTAAACCG TTTAAAATTT TCGATAAACC 3720 

CAAGTATGAA AAGACTTATG TAGACGCTAA AGGTAAAACA TATCATTATA gTGTTCCACC 3780 

ATTGTTTGCT TTTATTACAA CGTTTTTAAT TGGTATATTG ACAGGTTTAT TTGGTATTGG 3 84 0 

AGGTGGCGCA CTAATGACGC CACTAATGCT TATTGTATTT AGATTTCCAC CTCATGTAGC 3 900 

TGTTGGAACA AGTATGATGA TGATTTTCTT TTCAAGTGTC ATGAGTTCTA TAGGGCACAT 3 960 

TGCTCAAGGT CACGTAGCTT GGGGTTATGC AATCATnTTA ATTATTTCTA GTTATTTTGG 402 0 

TGCGAAAATC GGTGTCAAAG TGAATCAATC AATTAAGTCA GATACGGTAG TAACATTATT 4 080 

3S GAGAACAGTA ATGTTGTTAA TGGGTATATA TTTAATTATT CGTGCGTTGA TTTAATACAA 414 0 

CTTTAAAAGG AGGACGTCAA TTTGAGGCTT ACAATTTATC ATAOGAACGA TATTCATAGT 4200 

CATTTACATG AATACGAACG CATTAAAGCA TATATGGCAG AACATCGGCC ACGACTTAAT 4260 

CATCCTTCTT TATATGTTGA TCTAGGTGAT CATGTAGATT TATCCGCACC TATAACTGAA 4320 

GCAACTTTAG GTAAAAAGAA TGTGGCATTA CTAAATGAAG CAAAATGTGA TGTTGCAACA 4380 

ATCGGTAATA ATGAAGGGAT GACCATTTCA TACGAAGCTT TAAATCACCT TTACGACGAA 444 0 

GCAAAATTTA TAGTGACATG TAGCAATGTT ATAGATGAAT CAGGTCATTT ACCAAATAAT 4 500 

ATCGTTTCTT CTTATATTAA GG ACATAGA C GGTGTGAAAA TACTATTCGT TGCAGCGACA 4 560 

so GCACCTTTTA CCCCATTTTA TCGTGCACTA AATTGGATTG TTACCGATCC ACTTGAATCT 4620 

ATAAAAGAAG AAATTGAACT TCAACGAGGT AAATTTGATG TATTAATCGT GCTAAGTCAT 46 80 

TGTGGCATTT TCTTCGATGA AACATTATGC CAAGAATTGC CTGAAATTGA TGTCATTTTT 474 0 
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GCAgCTGGAA AGTATGGTAA TTATCTTGGA GAGGTTAATT TAACTTTTGA 


GGCACATAAA 


4860 




GTAGTACATA 


AAACTGCAAA 


GATTATTCCT 


TTAGAAACAT 


TACCTGAAGT 


TGAAACTTCA 


4920 


5 


TTTGAAGAAG 


AAGGAAAAAC 


GTTAATGTCC 


AATTCAGTAA 


TTCAACATCC 


AGTAGTGCTT 


4980 




AAGCGTAGTA 


TGAATCACAT 


AACTGAAGCT 


GCATACTTAT 


TAGCT CAAAG 


TGTTTGTGAG 


5040 


1 0 


TATACACATG 


CACAATGTGC 


CATCATCAAT 


GCTGGCTTAC 


TCGTTAAAGA 


TATTGTAAAA 


5100 


GATGAAGTGA 


CAGAATATGA 


CATTCATCAA 


ATGTTACCGC 


ATCCGATTAA 


TATGGTAAGG 


5160 




GTTAGACTTT 


TTGGTGTGAA 


ATTAAAAGAG 


ATTATAGCTA 


AAAGTAATAA 


ACAAGAATAT 


5220 


15 


ATGTATGAAC 


ATGCACAAGG 


TTTGGGTTTC 


AGAGGGAATA 


TATTTGGAGG 


ATATATTCTT 


5280 




TATAATTTAG 


GGTACATTCA 


TTCTACAGGG 


CGTTACTATC 


TGAATGGAGA 


AGAAATCGAA 


5340 




GACGACAAAG 


AATATGTACT 


AGGTACGATA 


GATATGTATA 


CGTTCGGTCG 


TTATTTCCCA 


5400 


20 


ACATTGAAAG 


AATTACCAAA 


AGAGTATTTA 


ATGCCAGAGT 


TTTTAAGAGA 


TATATTTAAA 


5460 




GAAAAATTAT 


TGGAATATTA 


AAAAGTAAGA 


TTATTGGATT 


TTCATTTGTC 


ATGAATTTCG 


5520 




ATATAATGTT 


TAAAGATACA 


CTTAACAGGA 


GGGTATGTGT 


TGTTATGGCG 


ACAAAAAACG 


5580 


25 


AGGAAATATT 


ACGTAAACCG 


GATTGGTTGA 


AAATAAAATT 


AAATACCAAC 


GAAAACTATA 


5640 




CAGGACTTAA 


GAAGATGATG 


AGGGAAAAAA 


ATCTTAATAC 


TGTATGTGAA 


GAAGCTAAAT 


5700 


30 


GTCCTAATAT 


ACATGAATGT 


TGGGGTGCAC 


GTCGTACAGC 


GACATTTATG 


ATTTTAGGTG 


5760 


CCGTATGTAC 


AAGAG CTTGT 


CGTTTTTGTG 


CGGTTAAGAC 


AGGTTTACCT 


AATGAACTTG 


5620 




ATTTAAATGA 


GCCTGAACGT 


GTAGCTGAAT 


CAGTTGAATT 


AATGAATTTG 


AAACACGTTG 


5880 


35 


TTATCACTGC 


TGTTGCGCGT 


GATGATTTAA 


GAGATGCTGG 


TTCAAATGTT 


TATGCTGAGA 


5940 




CAGTACGTAA 


AGTTAGAGAA 


AGAAATCCAT 


TTACAACGAT 


TGAAATTTTA 


CCATCAGATA 


6000 




TGGGCGGGGA 


CTATGATGCG 


TTAGAAACAT 


TAATGGCGTC 


AAGACCTGAC 


ATTTTAAACC 


6060 


40 


ATAATATTGA 


AACTGTTCGT 


CGCTTAACAC 


CGAGAGTTCG 


TGCGCGTGCG 


ACTTACGACA 


6120 




GAACATTAGA 


GTTTTTACGT 


CGTTCAAAAG 


AATTACAACC 


GGATATCCCA 


ACTAAATCAA 


6180 




GTATTATGGT 


TGGATTAGGT 


GAAACTATAG 


AAGAAATTTA 


TGAAACGATG 


GATGATTTAC 


6240 


GTGCGAATGA 


TGTAGATATT 


TTAACGATTG 


GTCAATATTT 


ACAACCTTCA 


CGTAAACATT 


6300 




TAAAGGTTCA 


AAAATATTAC 


ACGCCTTTAG 


AGTTTGGTAA 


ATTAAGAAAA 


GTGGCAATGG 


6360 


50 


ATAAAGGGTT 


TAAACATTGC 


CAAGCTGGAC 


CTTTAGTACG 


TAGTTCTTAT 


CATGCGGATG 


6420 




AGCAAGTAAA 


TGAAGCTGCT 


AAAGAAAAGC 


AACGCCAAGG 


TGAGGCACAG 


TTAAATAGTT 


6480 




AATATTTAAC 


CATTAATAAG 


GCATAAAGGC 


TTAGTTTGTA 


CAAAACGAAC 


GTGTCATAGA 


6540 
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AGGTGAAGAA TTTGATAAAA GTAGATCAAC ATTACTTTGA ATTAATAGAA AATTATCGCG 6660 

AATGTTTTAA TGAAGAACAA TTTATTGCTA GGTATTCAGA TATTTTAGAT AAATATGATT 6720 

ACATAGTTGG TGACTATGGT TACGATCAAT TACGATTAAA AGGTTTTTAC AAAGATTCTA 6780 

ATAAAAAAGC AGAGATGAGT AAACGTTTTT CAAATATTCA AGATTACATA TTTGAATATT 6840 

GTAACTTTGG TTGTCCTTAC TTTGTATTAA GACATTTGTC TAAACAAGAG GTTAAAAAGT 690 0 

TAATCGAAGA AGTTCATCCG TCTGATGTGA TAGATGACGA CAATAAACTT CAAGATGTGA 6960 

AGATTAAGCC AACCATTCAA GATACTGAAC ATTAATAAAA CCCTTAGCTA GATTGAAAAT 7020 

GGGAATCATG CAATTCAAGC ATGGACCTGT AATCTAGTTA GGGGTTTTTA TCTTTAATGA 7080 

ATGACTTCAT TTAAATACTC AGTAATTTCA TCGCCTTCTT CAG CATTTAC ACCTAAAATA 7140 

TGAGCGATAT AGCCTTCTTC TTTTAAATCA TCAGTACCGA TAATACCGAA TTTATTTGTT 7200 

TG CAT ATT AA GTACGAGTGT CTTAC CAT AA TGTCTATTTG TATGGACTAA CATCAAATCA 7260 

TATCGACTAT GCTCGCCAAC AAAACCAACA AACTGAACTT GACTCTCTTC GTTGTCATCA 7320 

TATAAATACA TATCAATCAT TTTGTAGCGA CTCCTTTTAA AAGTAGTAAA GTTAGTATAA 7180 

CGACAAATGA AGTATACTGC AAAATTATGA TAATATATAA GTGAGAGGTG ACAAGGAATG 744 0 

TATTTTGTAG ACAAAGATAA ACTAACTCAG AAATTAGCCT ATTTACAAGC ATTAACTGAT 7500 

GATTATCATG AGAGCAAGCA CAATCATTAT GCATTTGAAC GCATTGCTCA AATGTTGATA 7560 

G AATC AT CGG TAGATATAGG GAATATGATT ATCGATGCAT TTATTTTAAG GGATCCTGGT 7620 

AATTATAAAG ATGTGATTGA TATATTAGAA CTAGAAAATG TTATTACTAA AGAAACACAG 7680 

CAGGCGATTA ATAAAACTGT CGGTATTCGT AAACAATTTA CATATGATTA CACAGCCTTA 7740 

gatgttgaga ttatcatgcc aatgtttga 7769 
<2) Information for seq id no: 215 : 

(i) sequence characteristics: 

(A) LENGTH: 644 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



45 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 215: 

50 ACCGCCACCC ATTAATGATT GCTTAAAATC AATAGTCGTA CCATTTAATA CGGGTGCATC 60 

TTTTTTGTCT ACTAATACTT TTAATCCAAA GTATTCTAAG ACTTCATCAT TTTCACCAGG 120 

CGCTTCTTCT GCACCCATAC CGTATGTTAA ACCAGTGCAC CCGCCACCAT TCACTTTAAT 180 
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TCCTTCTGTT AATATAACTG TTGGCATGAT AACTCCTCCT TAAAAAATCC AAGTTTCTTT 
TATATGTGCA TATATATTTT GTAATAATTC TTCCGGCGAA TCACCTTCAA CAATATCACC 
ATTTACTAAA GCATACAACC CGGCTGAACA TATACCACAA TGTGTCAGGC AACCATACTC 
TAACACATCG ACATCTGGGT CATTTTCCAG TTGATTAAAA ACATAATCTC CACCTTTTGC 
CATGTTAGAG AGACAAAATT CTACGATCGG ATTCATACTT CACCTTCTTA TTTCATTTGT 
TACAATATTA TAGCATTTTA AAACTGGTAT TTTAACATGA TGTGCTCAAT TAG CAACAAC 
TGATGTTTCT TATCCCAGTT ATGTAATAGT GCCTTAGTTA GTAC 
(2) INFORMATION FOR SEQ ID NO: 216: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1578 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDN ESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 216: 
GAATGATGAA AGGAATAGAA AAGAAAAGAT AAATAATGTA ATAGATTTAT CCGAGAAAAT 
TGAAAGAACA AAAGATATGC CAATCAAGAA TACTATAACT ACTCAATTAG GAAATAAACT 
TATTGGCACA AAAAAAGCTC GTTTTGATGA TAAGAAAGTA GTGTCGTTTG GAGCATTTGA 
AGATGAATAA AATAAATGAT AGAGATTTAA CAGAATTGAG TAGCTATAGG GTTTATCAAG 
ACATCAATAA AGATAATGAC TTTACAGTTA ACGAAAAACG ATTTAAGCAG GCAGATGTAT 
TTGAAGATTT ATATAGAGAG AAACTAAAAG ACACAAATAA ATTAAGAGAG TATAATTATT 
TACAAAATGA AACTTTTAAA AGCGCATAAA TAGGTGATGA GAT ATG CTT A AAAAAGCAAA 
ATTTSTCTTA ATGGCAACGA TACTACTATC AGGATGTTCA ACTACCAATA ACGAATCCAA 
CAAAGAAACA AAATCTGTAC CAGAAGAAAT GGATGCTTCA AAATATGTAG GACAAGGATT 
CCAACCACCT GCAGAAAAAG ATGCGATTGA ATTTGCAAAG AAGCATAAAG ATAAAATTGC 
TAAGCGAGGC GAACAATTTT TTATGGATAA CTTCGGTCTA AAAGTTAAAG CTACAAATGT 
TATAGGTAGT GGCGATGGTG TAGAAGTATT CGTGCATTGT GATGACCACG AyATCGTATT 
TAATGCGAGT ATTCCATTTG ATAAATCAAT wATTGAsAGT GATAGCTCAT TAAGAAGTrA 
GGAyAAAGGy GATGATATGA GTACTTTAGT TGGTGCAGTA CTCAGTGGGT TTGAATATCG 
AGCACAAAAA GAAAAATATG ATAAATTATA TAAATTTTTC AAAGATAATG AAGAGAAATA 
TCAATATACA GGATTTACAA AAGAAGCAAT TAATAAGACG CAAAATAGTG GTTATGAAAA 
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AC CATTGTTA 


AACAAAAGTG 


ACAGTGAATT 


TTCAAAAGAA 


TTGTCAAATG 


TTAAGAAGCA 


1080 


ATTAAAAGAT 


AAGTCTAAAG 


TTTCGGTAAC 


TACTACTCTA 


TTTAGTAAAA 


AAAAGAACTA 


1140 


TACTAAAAAA 


AGTAACAGTG 


AAAATGTAAT 


AAAAATGGCA 


GAAGAAATAA 


AAAAAGATAA 


1200 


AGAGATACCA 


AACGGTATAG 


AGCTTAGTAT 


AAAATTTTCG 


GACAATAAAA 


TAAATACGGT 


1260 


TAAACCAAAT 


TTTAACGGTG 


aAAGCACTTC 


AGAATATGGT 


GTGTTTGATC 


AAGAATAAAA 


1320 


TTAATGATGa 


AAATTTAACG 


GAGAATAGTG 


TATATTGAGT 


AGATCmAGAA 


TAAAAAGATA 


1380 


ATTCTACTAT 


TGTTGTGAAG 


GCAAATAAGT 


AGAAGATTTT 


AAGTGTAATT 


TCTGGTGATT 


1440 


TAAATAATAA 


TATAnATGGn 


AGTACTGATA 


TAAnACTTTT 


TAAC CTACTA 


GATTCTTATA 


1500 


ATTTGCTTTC 


CATTTTATGA 


cgatttttac 


TCCAATTGAG 


TGATAGAATC 


CAAAAAAGCC 


1560 


ATCTCCAAAA 


ATTAATCC 










1578 



20 

(2) INFORMATION FOR SEQ ID NO: 217: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5137 base pairs 
2S <B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 217: 



35 



40 



TGTTTTCCTT 


GGGTTAAAAC 


ATGCTTGCTA 


TGCGTTTGTA 


AATATGACTT 


GCTGTTTTnA 


60 


CCTGnATACC 


CGTCACACCA 


TGGAAGTAAA 


AATGTTTCTT 


GCTCTTGGCT 


TACAATTTTA 


120 


GCTTTAATCG 


CTTCATATGC 


TTTATATTGG 


TCTTCTGTTA 


ATTGCTGTTT 


TGATTCTTGT 


180 


TCGAAAACAC 


GATCTTTAAA 


TGGGTCTCTT 


TCAACAACCG 


CGTCATATTT 


TTCAACATAA 


240 


CCTTTTTTGA 


TAAGTCCATC 


TAAACTGGAT 


TTTGAAAAGC 


CCATATCCTC 


AATATCAGTT 


300 


AAAAATATTG 


TTTTATGTTG 


TTCTTCAGAC 


AAGTAAGCAT 


ACAAATCGTA 


TTGTTTAATA 


360 


ACTTTCTCCA 


ACTTAGCTAA 


TACTTCATCA 


GGATGATACC 


CTTCAATGAC 


ACGAACAGCA 


420 


CGCTTGGTTT 


TTTTAGTTAT 


ATTTTGTGTG 


AGAATCGTTT 


TTTCTTCAAC 


GATATCATCT 


480 


TTTAACAACT 


TCATAAGCAA 


TTGAATATCA 


ttattttttt 


GCGCATCTTT 


ATAATAATAG 


540 


TAACCATGCT 


TAT CAAATTT 


TTGTAATAAA 


GCTGAAGGTA 


GCTCTATGTC 


ATCTTTCATC 


600 


TTAAATGCTT 


TTTTATACTT 


CGCTTTAATA 


GCACTCGGAA 


GCATCACTTC 


TAGCATAGAA 


660 


ATACGTTTAA 


TGACATGAGT 


TGAACCCATC 


CACTCACTTA 


AAGCTATTAA 


TTCTGATGTT 


720 


AATTCTGGTT 


GTATATCTTT 


CACTTCTATG 


ArrrrrriTA 


ACTTCGAAAC 


GTCAAGTTGT 


780 
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ACAATTACAC GCACACCAGG TTGGATGACA 
AATTTATAGT CAACGCTCTT CGACGCGACA 

5 

ACCTAGTTTC TAGTTCATCT AAAATTTGTG 
TATTTACTTT TTCATTATTT TTAAAATGCA 

w CGATAGACAT ATCCCCAACA TTATTTGAAA 

TTTGTTGTGC ATAATTTTCA ATATCTTCAG 
ATGTTTTATG TTCACCTAAA TATTTAAGAA 

15 AATCAC CATC CTGCTTTTTC ATCTTATGTT 

CGGCTGCTGC TTTTACAACA ATATCTTGTT 
TTTCTTCAGC ACTTTGAACA TGAATAACTT 

o/-> 

GACCAGCAAC TAACGTCACG ATAG CTCCTC 
CCATTTTTCC AGAAGAACGA TTGGATACAA 
GTCCTGCTGT AACCAATGCG CGTTTATCTT 

25 

TTTGAAAATG AGCATCAATT ACAGAAACGA 
CAACATAACC ACATGCTAGA AATCCGCTTC 

30 TTAAAATATT AATATTTTGC TGCGTACGTT 

GCGCAATAAA TTTCGGTGTC TCTGTTGCTA 
TACCTACACT CAATTTTGCA ATTGTATTTG 

35 CCCAATCACC TAATGCAATA TGCTGTATTT 
TATAAACAGC ATTTCGACTT ATTGCTTGAA 
GATTGGTTAA CATAACGCGA ACTTCATACC 

40 

TTG CTTT AT A TGCCGCAATG CCACCTGTAA 
TCCCTTAAAT ATCACTATGA CATTTACGCT 
TACTTTTTTA TAGATACAAA TTTAGTATTA 

45 

AAACACACCT ACATAGGTGC GTTTGATTTG 
AGCTTCACAT ATTTTTAATG GTCGAAACTA 
50 AGGGCGAATT TTACCGTCAG CAATTT C TTC 
ATATTCACTT AATAATTCAG TTTCAGGTTG 
AGTTGTTGCA ATTAAATACT TTGATTTAAT 

55 



GATTCGAGTT GTTCGGGAAT TATATAATCA 900 

TCGACTATGA CTTTCGCTAT CATTATTGCC 960 

CAGCTAATAC TACTTTTTTT CCTTTCTTGA 1020 

TTGTCAATTC ATTATCATCA GAACTAAATC 1080 

TAATCACATC TGCATTTTTC TTGCGTAATT 114 0 

TCTCTGCTGC AAAGCCTATT AAATACTGTG 120 0 

TGTCTTTAGT ACGTTTAAAA GATACTGACA 126 0 

CTAATACATC AACCGGTGTA TAGTCAGATA 132 0 

CGTCAAATCG GCTTGTCACT TGTTCAAACA 13 8 0 

CAATATCTTT TGGATCCTCT AGTGTTGTAG 144 0 

GATTTCGCAA TGCTTCAGCT ATTGCATAGC 1500 

ATCTGACTGG ATCGATAACT TCAATAGTTG 1560 

GAAATGAACT ATTAGCTAAA CGATTACTAT 1620 

TTTGAAGCGG TTCTTCCATA CGTCCTTTAG 1680 

CTGGTTCGAT AAAATGATAC CCATCTTCTT 174 0 

TATTTTCATA CATATGCACA TTCATAGCAG 1800 

GCAACGTTGA TGTCACCAAA TCATCAGCAA 1860 

CCGTTGCAGG TGCAACAATG ATTGCATCTG 1920 

CTGAAGGATT TTCTTCTATA AAAGTATCTG 1980 

ATGCTAATGG TGTCACAAAT TTTTGTGCGT 204 0 

CAGATTGTGT TAACTTACTT GTCAAATCAA 2100 

CGGCTAATAA TATTTTCTTC ATATTCAATC 2160 

TTACATCATC ATATGCGCAC AAATGCTCAT 2220 

TTATAACATC AATCATTGGA TAAACTAAAA 2280 

GATATGCCTT GACGTATTTG ATGTACGTCT 234 0 

TTCTTTACCA TAATAATCAC TTGAAATAAC 2400 

TAACGCTCTA CCAACTGGTT TAAATGAATG 24 60 

TTCATCAATT TCACGCGCTC TTTTCGCTGC 2520 

TTGTGaCGTT aATTGGTTtA AAgGTGGATT 2580 
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TTTArGTGcT CAGCTTCTAC AATACATTGA ATTCtATTCy TCGcAAGtTC TACTTCAt CA 2 J 00 

TTAACTACAA cGTAAyCGTA TAAATTCATC ATTTCrACTT CTkTACGCGC yTCGTTAATA 2760 

CGACTTTGTA TTTTCTCATC AGATTCTGTT CCTCTACCTA CTAATCGCTC TCT CAAGTGT 2 820 

TCTAAACTTG GAGGTGCTAA GAAAATAAAT AGCGCATCTG GAAATTTCTT TCTAACTTGC 28 BO 

w TTTGCACCTT CTACTTCAAT TTCTAAAAAT ACATCATGAC CTtCGTCCAT TGTATCTTTA 294 0 
ACATATTGAA CTGGTGTACC ATAATAGTTG CCTACATATT CAGCATATTC TATAAATTGG 
TCATCTTTGA TTAAAGCTTC AAACGCATCC CTAGTTTTAA AAAAGTAATC TACG CCATCA 

ACTTCACCTT CACGCATTTG ACGTGTTGTC ATTGAAATAG AATACTTATA TGATGTACTT 3120 

GGATCTTCAA ATATnCGTnT TCTAACAGTA CCTTTACCTA CTCCAGATGG TCCTGATAAA 3180 
ACGATTAACA ATCCTTTTTC ATTATCCATG CCTTACGACC TCTCTAAGCT AATCTTCTAT 
TATTTAAATA TGATATCACA TTGTTCTTTA TATTGTATAG CATATTTGAA ATTG CATGCC 

ATAATTTCTA TTAAGTCTAA CAATATCGTT ATATTGCACG ATTAATTTTA ATTAAATAAA 336 0 

25 TTGAATTGCA AACTTTTAGA TAATGTAAAA TGTATGGCAT AATGTATGGT TCAATAACTA 3420 

TACTGAAAAG TTACAATCAT GTTAAAATGA AACGAATGAT ATGAAGAAGG TGGAAGATAA 34 80 

ATTATGGCTT ATGATGGCTT ATTTACAAAG AAAATGGTTG AGTCTCTACA ATTTTTAACA 354 0 

30 ACAGGACGTG TTCACAAAAT CAATCAACCT GATAATGACA CGATACTAAT GGTTGTACGT 3600 

CAAAATAGAC AAAACCATCA ATTGTTATTG TGAATCCATC CAAACTTTTC AAGATTACAA 3660 

TTGACTACTA AAAAATATGA TAATCCATTT AATCCACCCA TGTTTGCGCG TGTTTTTAGA 3720 

AAACACTTAG AAGGTGGTAT TATCGAATCG ATTAAGCAAA TTGGTAATGA TCGTCGCATT 3780 

GAAATCGATA TAAAGAGTAA AGATGAAATT GGCGATACTA TTTACCGCAC TGTCATCCTT 3840 

GAGATTATGG GTAAACATAG TAACTTAATT TTAGTAGATG AAAATCGCAA AATAATTGAA 3900 

GGATTTAAAC ACTTAACACC AAATACGAAT CACTATCGTA CAGTAATGCC AGGATTTAAT 3 960 

TATGAAGCAC CACCTACTCA GCACAAAATA AATCCGTATG ATATTACAGG TGCAGAGGTG 4 020 

45 TTGAAATATA TCGATTTTAA CGCAGGTAAT ATTGCTAAAC AATTATTGAA TCAGTTTGAA 4 080 

GGATTTAGCC CTTTAATTAC GAATGAAATC GTTAGTCGTC GTCAATTTAT GACTTCATCA 4140 

ACATTACCAG AAGCATTTGA CGAAGTAATG GCAGAAACCA AGTTACCACC TACTCCTATT 4 2 00 

SO TTTCATAAAA ATCATGAAAC AGGTAAAGAG GATTTCTATT TTATAAAGTT AAATCAATTT 4260 

AATGATGATA CAGTTACATA CGATTCATTA AATGATTTGC TTGATCGTTT TTATGATGCG 4 3 20 

CGTGGCGAAC GTGAACGCGT TAAACAACGT GCGAATGATT TAGTTCGATT TGTTCAACAG 4 3 80 
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ATAAAGATAC TGAACAGTTA TATGGTGAAT TGATCACTGC TAATATATAT CGAATTAAGC 4 500 

AAGGCGATAA AGAAGTGACG GCATTGAATT ATTATACGAA TGAAGAAGTT GTCATTCCTT 4 560 

TAAATCCTAC AAAATCCCCA TCAGCAAATG CTCAATATTA TTATAAACAA TATAAyCGTA 4 620 

TGAAAACGAG AGAmCGTGAA TTACAACATC AAATTCAATT GACGAAAGAC AATATAGATT 4 680 

ATTTTTCAAC AATCGAACAA CAATTACATC ATATTTCTGT CCATGACATT GATGAAATTA 474 0 

GAGATGAATT AGCAGAACAA GGCTTTATGA AACAGCGTAA AAATCAAACT AAGAAAAAGA 4 800 

AAGCGCAGAT TCAATTACAA CATTATGTAT CAACTGATGG CGACGATATA TATGTTGGTA 4 860 

15 AGAATAACAA GCAAAATGAT TATTTAACAA ATAAAAAAGC TAAAAAAACT CACACATGGT 4 920 

tACACACAAA AGATATTCCT GGTTCACATG TCGTTATATT TAATGATGCA CCAAGTGATA 4 980 

CGACAATCAA GGAAGCGGCT ATGTT AG CAG GATACTTTTC AAAAGCTGGT AATTCTGGAC 504 0 

AAATACCTGT TGATTATACA TTAATTAAAA ATGTG CATAA AC CATCaGGT GCAAAGCCTG 5100 

GGTTTGTAAC ATATGACAAT CAAAAAACTT TGTATGC 513.7 
(2) INFORMATION FOR SEQ ID NO: 218: 

25 

. <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2267 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 
so (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 218: 

GTTTTATCGC AGCAGTAAAG CTATCAATCG GCGGTTCAAT TGATGATGCA TTAGCAGAAA 60 

TCAnACAATC ATTTT AG TT A AAATTTACTA ATAATGAaAA ATGTAAACCT TTTTCAAATG 120 

AAACTTTATa AaAAATATGA TAGTATATAT GTAAATGTTT AATAAAATCT GGAGAAATAG 180 

GAGGACATTG CCATGCAACA CCTTATAAAA AAACATGTAT TGAATGGCGA GTTTGATTTA 240 

GTACGACAAT TGATGTCCGA AACAGATTTT ATGGAATTTG AAGAAGCATA TATTTCAAGT 3 00 

GCGCATGAAG TAGAAAGTAT GATGTTTTAT ACATGTATTT TAGATATGAT TAAGTACGAA 3 60 

GAATCATCTG AAATGCATGA CTTAGCATTT TTATTGCTTG TGTATCCACT AAGTGAATAT 420 

GAAGGTGCTT TGGATTCTGC TTATTATCAT GCAGACGCTT CCATAAAACT TACTGACGGC 4 80 

50 AAAGAAGTTA AAAGTTTGTT ACAAATGTTA TTATTGCATG CGATACCAAC ACCTGTTATT 540 

TCAGATAAGA AGGCTTTTGA TATCGCCAAG CAAATTTTAA AATTAGATCC TAATAATAAT 6 00 

GTTGCTCGTA ACGTCTTAAA AGACACTGCC AAACGTATGC gACAaCGTTG TTGTTGATAT 660 

ss 
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AGTTTTAACA TTTGGTTGGG TTGGGCATAT GTTCCAGCCT TTTTTAATAC TTAAAAACTA 
5 ACGAAgTATA CTTGTGTGCA CAAATGGTTT TTATACAACA TTTTATAAAT TTATACATTT 

TAATAAAGAA CATACGATAG ATGGTTTAAA CCTTGTTAAC TGAGAAATTT TGATATGTAT 
TCTTCGAAAT TTAACTAAAT ATACGAAATT CAAGAAGCAC AATAATTAAT CATTTTTCCT 
W ATACAAAAGT TCGTATGACT GCATTATAAA AGCATAAATT TATAATTTTT TTAAATGTCA 

TTGAACGTGA TAATGTGAAT GGATTGAGCA ATTTTGAAAA AGTGAAAAAT AACCTATGCG 
ACTTGCAATT AATTTTCAGT ACGTTATAAT GCACACTGTG CAAAATTAAG GAGGTCTATT 
« ATTCACATGA TGATGAaTAA AGAAGCAACA AAAATTGGAT TTGCCTACGT CGGCATTGTA 

GTGGGCGCAG gATTTTCAAC TGGACAAGAA GTTATGCAAT TTTTCACTAA ATATGGCTTG 
TGGGCTTATT TAGGTGTTAT TATATCTGGT TTTATTTTAG CTTTTATTGG GCGCCAAGTA 

20 

GCAAAAA* iG GTACTGCCTT TGAAGCGACA AATCATGAAT CAACATTACA ATACGTATTC 
GGTGAAAAGT TTAGTAAAGT CTTTGaTTAT ATTTTAATCT TCTTCTTATT TGGTATAGCT 

25 GTAACCATGC tAGCTGGTGC AGGCGCAACA TTTGAAGAAA GTTATAACAT ACCTACATGG 

CTAGGTGCTT TaATTATGaC ATTAGCGATT TATATTACGT TGCkATTAGA CTTTAATAAA 
ATAGTACGTG CACTAGGTAT CGTTACACCA TTTTTAATTG TTTTAGTTGT ATTAATCGCT 

30 GGCGTTTATT tATTTAAAGG TCATG t TTCA TTAGCAGAAG TTAACCAAGT AGTGCCtGAA 

GCAAGTATTT GGAAGGGAAT CTGGTTTGGT ACAATATATG GTGGATTAGC TTTTTCTGTA 
GGTTTTAGTA CCATCGTAGC AATCnGTGGG GATACTGAAA AGCGTACAGT GTCAGGTGCA 

35 GGCGCGATGT ATGGTGGTAT TATCTATACT GTATTACTAG CATTGATCAA CTTTGcATTG 
CAAGTGaATA TCCAACTATT AAAAATGCCT CAATTCCTAC ATTGACGTTA GCAAATAATA 
TCCATCCTTT AATAGCAACA GTGkTATCTG TTATTATGCT GGCGGkTATG TATAATACTA 

40 

TTCTAGGACT AATGTATTCA TTTGCAGCAC GTTTTACAGA ACCATACAGT AAAAATTATC 
ATATCTTTAT TATTATAATG ATGGTAGCAG GTTATTTATT AAGTTnCGTA GGATTTGCTG 

45 AATTAATTAA TAAGTTATAT ACnATTTATG GGATATGTAG GCTTATTnTA TTGTAGTAGC 
TGTAATTATn AAATATTTCC AAACGTAAAA ATGGCGGATA AAAAACATAT TGCTTTAATA 
TCATATGGAG GGGATATCCG AAACTTTACA ATTTGAATCA CTTTGGT 

SO (2) INFORMATION FOR SEQ ID NO: 219: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6336 base pairs 

(B) TYPE: nucleic acid 
55 (C) STRANDEDNESS : double 
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w 



25 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 219: 

GTCAATGTAA CCTAATAGTT TATGTCTATC TTGTGTACCA ACTACTACAT CGACACCAGG 60 

AATTTCCATA ATTTCAGCTG ATGAAGTTTG CGCATAACAA CCTGTTACAC AGATTACAGC 120 

ATCAGGATTT TGTCTTATTG CACGTCTAAT TATTTGACGA CTTTTTTTAT CACCCGTATT 180 

CGTTACTGTA CAAGTATTAA TAACAAATAC ATCAGCATTC GCTTCAAAGT CAACGCGCTC 24 0 

AT AGTTTG CT TCTTTAAATA ATTG CCAGAT TGCTTCAGTT TCATAATGGT TTACTTTACA 300 

15 ACCTAATGTG TGaACGCAAC TGTTGACATA AATATTCACC CCATTAATTC TTTTTCATAA 36 0 

CTTATTGCAC TTAACGCATA CAATGGCGCA GTTTCTGCCC GTAAAATTCT CGGCCCAAGA 42 0 

CCAACAACTG TACTAGTATT ACTAAATAAT GAAATTTCAT TTTCTGACAA ACCACCCTCA 4 80 

20 GGaCCAAAAA TCATCAACAC TTTATCCTGA GCATTGAATT GTTGTAAAGT TTGCTTGAAA 54 0 

TTGCTTAACT CACCATCTTT TGCTTCCTCT TCATATGCAA TAAGAATATA GTCATAATTA 600 

TCAATAGTAT CACAAATTAA TTTTAAATTC GACTCGAATT GAATAGATGG AATCACTAAA 660 

CGATAGCTTT GTTCAGCAGC TTCTTTAATT ATTTTTTGCC AACGCTCTAT CTTTTTGGCA 72 0 

ACTTTTGCCT CGTTTAATTT AACAATTGAA CGTTCCATGC TCACAGCTAT AAATGATGAA 780 

GCACCCAATT CAGTAGCTTT TTGTAGCAAC CACTCATATT TGTCAGCTTT GATTAGTCCA 84 0 

CTGCAAATCG TAACATCAAC TGGCAATTCT GTATTAATAT TTTGTTTTTC TTTTAAATCA 900 

ACTTCAATTT TATCACTTGT TATGTCAGCA ATTTCACATA AATAAACTGT TTGATCATTA 96 0 

35 AAAGTTAAAA TAATTTTACT ACCAACATCA TATCTCATTA CATTTGTTAT ATGATGAATA 1020 

TCTTCTTTTT TTGTAATAAA AAAACGCTGA CTTACATCAG CGTTTTGGnT CTATGAAATA 1080 

ACGTTGCACA TTATTCACTC ACTTTCTGGC CAACAAGACA AACCCAACCG TTGTCATGTT 114 0 

GTTCTGAAAT AATTTTAAAA CCTACACGCT CCATATGTGA CTGTATACCT TCATACTTCT 1200 

CTTTTATAAT ACCAGAAGTA ATAAAATAAC CGCCTTCATT TAGAGTATTA TAAGCATCTT 1260 

CAATCATTTC ATCAATAATA TGCGCTAAAA TATTTGCTAT TACAATATCA AATTTTTCTG 132 0 

TTTCGTCTTT CAATAAGTTA CCTGGAACAG CTTCAATTAA CGTTTCACAA TGATTTCTTC 13 80 

TGAAGTTTTC TTT AG CT ACA CTCACTGCCA TTTCATCAAT ATCCAACGCT TTAATACGTT 144 0 

so TTACACCGAT TAGATGACTT GCAATACTTA ATATACCTGA GCCAGTACCA ACATCAATTA 1500 

CTGAATGCTG TGGCAATACA TATGTTTCTA TTGCCTTCAA ACACATACTT GTAGTCGGAT 1560 

GATCACCTGT TCCAAAAGCC ATACCTGGGT CGAGCTCAAT GCAAAGCTCT TCATCCGCTT 1620 

55 
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GGAAATAGTT TTTCCATTCA TTTTCCCAAT CCGTCTCTGC AATAATTTGC TCACTGAATT 1740 

GAACGTTATG TTGATCAAG T TCATCTAAAT TTAATAACTC ATCTTTAATT TGCTGTCGCA 1800 

ACTTATCATC ATAAGTCATT TCATTAAAAT AGGCTTTCAA TCTTACTCCC TTATCTGGAT i 8S0 

AATCCTCTTT TTTCAAAGCG TAAATTTCAC CGTATTTATC TTCTGGTTGG TTAATTAAAT 1920 

w CATCTGAATC TTCTATCACG ACACCATTTG ATCCATGATT TTCAAGTATA TTGGTAGCCA 1980 

ATTCTACTGC TTCATGATTA ATAATAATTG AAAGCTCTGT CCAGTTCATA CTTTATTCTC 2040 

CCTTAAAGAA TCTTTTTGCT CTATCTTTAA AATTCGAAGG TTGTTCATTA ATTTCTTCAC 2100 

,5 CATTTAATTG GGCAAATTCT TTCATTAGTT CTTTTTGTCT AT CTGTT AAT TTAGTAGGCG 2160 

TTACTACTTT AATATCAACA TATAAATCTC CGTATCCATA GCCATGAACA TTTTTTATAC 2220 
CCTTTTCTTT TAAGCGGAAT TGCTTACCTG TTTGTGTACC AGCAGGGATT GTTAACATAA 
" * " * *nn A vjii x Aiui a a i ii Uiiwut'a'AA ACi CTG cttgt gggaagctaa 

CATTTAATTT GTAATAAATA TCATCACCAT CACGTTTAAA TGTTTCAGAT GGTTTAACTC 24 00 

TAAATACTAC GTATAAATCA CCAGCAGGTC CTCCATTCAC GCCTGGAGAG CCTTCACCAG 2460 

CTAATCTAAT TTGTTGTTCA TTGTCGACAC CTTCAGGTAC TTTCACTTCT AATTTAACTG 2520 

TTTTATTTTC AGTACCTTTT CCGTGACATG TTGGACAAGC TTCTTCAAAT TCTTGACCAC 2580 

30 TTCCATTACA TTTAGGACAA ACTTGTTCAG TACGAACTCT ACCTAAAATT GTGTTTTGTT 264 0 

CTACAGCTAC ATGACCAGCG CCATTACAGT AACTACAAGT CTTTTTACTT GTTCCAGGCT 2700 

TTGCACCATC ACCATGACAT GTTTCGCATG TTACATCTTT ACGGATTGAA ATTTCTTTTG 2 76 0 

35 TTGTACCAAA TACCGCTTCT TCAAATGTTA ATGTCATTGT ATACTGAAGA TCATCACCTT 2 820 

TTTGCGGTGC ATTTGGATCT CTTTGTCTGC CGCCACCGAA GAAAGAGCTA AAGATATCTT 2 880 

CAAA5CCGCC GCCACCGAAG CCACTAAAAC CGCCAAAGTC AGAGCCATTG AATCCTTGTC 294 0 

CACCAAAACC TTGTGGACCA TCATGTCCAA ATTGATCATA GcTTGCGCGT TTATTATCAT 3000 

CACTTAAAAC TTCATAGGCT TCAGAAATTT CTTTAAACTT TTCATCTGCA CCTTCTTCTT 3060 

TGTTAATATC TGGATGATAT TTTTTCGAAA GCTTTCGATA CGCTTTTTTG ATTTCATCTT 3120 

TTGAAGCATC CTTACTAATG CCTAAAACTT CAT AAT AAT C TCTTTTGGCC ACAGCTATCT 3180 

CTCCTTTTCT TAATTAACTC ATATAGTTTA ACGTAATATG TCATACTATC CAAATAAAAA 3240 

SO GCCAAAGCCA ATGTTCTATT GACTTTGACT TTTCAGATCA TGACAACATT CTAATTGTAT 3 300 

TGTTTAATTA TTTTTTGTCG TCGTCTTTTA CTTCTTTAAA TTCAGCATCT TCTACAGTAC 3360 

TATCATTGTT TTGACCAGCA TTAGCACCTT GTGCTTGTTG TTGCTGTTGA GCCGCTTGCT 3420 



55 



BNSDOC1D: <EP 078651 9A2_I_> 



970 



EP0 786 519 A2 





TATCTTCTAT 


ATCTTGACCT 


TCTAAAGCAG 


TTTTAAGAGC 


GTCTTTTTTC 


TCTTCAGCAG 
TCAACTTGGA 


3540 




ATTTTTTATC 


TTCTT CACCG 


ATATTTTCGC 


CTAAATCAGT 


TAAAGTTTTT 


3600 


5 


ATACTAGACT 


GTCAGCTTCG 


TTTCTTAAGT 


CTACTTCTTC 


ACGACGTTTT 


TTATCTGCTT 


3660 




CAGCGTTAAC 


TTCAGCATCT 


TTTACCATAC 


GGTCGATTTC 


TTCGTCTGAT 


AATGAAGAAC 


3720 


10 


TTGATTGAAT 


TGTAATTCTT 


TGTTCTTTAT 


TTGTACCTAA 


GTCTTTTGCA 


GTTACATTTA 


3780 




CAATACCGTT 


TTTATCGATA 


TCAAACGTTA 


CTTCAATTTG 


AGGTTTACCA 


CGTTCAGCTG 


3840 




GTGGAATATC 


AGTCAATTGG 


AATCTACCAA 


GTGTTTTATT 


ATCCGCAGCC 


ATTGGACGTT 


3900 


15 


CACCTTGTAA 


TACGTGTACA 


TCTACTGATG 


GTTGATTATC 


TACTGCTGTT 


GAATAGATTT 


3960 




GAGATTTAGA 


TGTAGGAATC 


GTAGTGTTAC 


GTTCAATTAA 


CGTATTCATA 


CGTCCACCTA 


4020 




AAATTTCAAT 


ACCTAAAGAT 


AGTGGTGTTA 


CGTCTAATAA 


TACTACGTCT 


TTAACGTCAC 


4080 


20 


CTGTGATAAC 


GCCACCTTGG 


ATTGCAGCTC 


CCATTGCCAC 


TACTTCGTCC 


GGG TTTACTC 


4140 




CTTTGTTAGG 


CTCTTTACCG 


ATTTCTTTTT 


TGACAGCTTC 


TTGTACTGCT 


GGAATACGAG 


4200 


25 


TTGATCCACC 


AACTAAGATA 


ACTTCATCGA 


TATCTGAGTT 


TGTTAAGCCA 


GCGTCTTTCA 


4260 


TTGCTTGGCG 


TGTAGGTTCC 


ATTGTTCTTC 


TAATTAATGA 


ATCTGATAAT 


TCTTCAAATT 


4320 




TAGAACGAGT 


TAAGTTTACT 


TCTAAGTGTA 


ATGGACCGTT 


TTCACCAGCT 


GAGATAAATG 


4380 


30 


GTAATGAGAT 


TTGAGTTTGT 


GATACACCTG 


ATAAGTCTTT 


TTTAGCTTTT 


TCAGCAGCAT 


4440 




CTTTCAAACG 


TTGTAATGCC 


ATTTTATCTT 


GAGATAAGTC 


TACGCCATTT 


TcrrrrrruA 


4500 




ATTCTGCAAC 


TAGGTAGTCA 


ATAATTACTT 


GGTCAAAATC 


ATCACCGCCA 


AGTTTGTTGT 


4S60 


35 


CACCGGCTGT 


TGATAGTACT 


TCGAATACAC 


CGTCACCTAA 


TTCTAGGATA 


GATACGTCAA 


4620 




ATGTACCGCC 


ACCTAAGTCA 


AAAACAAGAA 


CTTTTTCATC 


TTTATCAGTT 


TTGTCTAAAC 


4680 


40 


CATATGCTAA 


TGCTGCAGCT 


GTTGGTTCAT 


TAATGATACG 


CTCAACTTCT 


AAACCAGCAA 


4740 


TTTTACCAGC 


ATCTTTAGTT 


GCTTGACGTT 


CAGCATCGTT 


AAAGTATGCA 


GGTACTGTAA 


4800 




TTACAGCTTT GTCAACTTTC TCACCTAAaA TAgTTTCAGC TGTA'rriTi'l' 


AAGTTTTGTA 


4860 


45 


AAATCATAGC 


TGAGATTTCT 


TGTGGTGTGT 


ATGATTTACC 


TTCAATATCT 


ACTTTATAAT 


4920 




CAGTACCCAT 


ATGACGTTTA 


ATAGATTGAA 


CAGTGTTTGG 


GTTTGTAATA 


GCTTGACGTT 


4980 




TTGCTACTTC 


aCCAACTTGA 


GTTTCTCCAT 


ITTTGAAAGC 


TACAACAGAT 


GGTGTTGTAC 


5040 


50 


GTGAACcTTC 


AGGGTTTTGA 


ATTACTTTTG 


GCTCATCGCC 


TTCTAAT Ac T 


GTnACACATG 


5100 




AATTTGTTGT 


ACCTAAGTCT 


ATACCAATAA 


TTTTACTCAT 


AATAAAATTC 


CTCCATTTAA 


5160 




TCATTAAATT 


AATTTAATTT 


TAAACAATGT 


CTTTTCGCCA 


AATTTAAGTT 


ATTGGTTTAC 


5220 
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AGTGATTTCG CCAGATTCAA AATCAGGGTT ATCATCTTGA ACTACAGCTT GGTGAATATT 5340 

TGGATCAAAT GCTTCACCTT CAGTTTTAAT AACTTCAAGA CCATTATCTT TTAGTGCGTT 54 00 

AATCAAACTT TCATGCACCA TTTGTACACC TTTTTGAAGA GATTTAAAAG TCTCATCATC 5460 

ACCTTCAATT TGAAGTGCAC GTTCTATATT GTCTATTGCT GGTAAAATAT CTGTTAACAC 552 0 

ACGTTGTGCT TGATATGTTT TGTTTATTTC ATTTTCTTTT TGAATT CT AC GCTTATAATT 5580 

TTCAAACTCA GCGTAGAGCC TTAAATATTT CTCTTCGTTT TCATCTGCTA ATTGTTGAAG 564 0 

TTCATTAATT TTTTGATCTT TTGGATCTAT TTCTTCAATA ACATTCTCGT CAGACGTTTC 5700 

TTCTATTG CT TCATCTTGTA AATGACCTTT ACTTTCTTCA GCTTGTTCAA CTGAATCATC 5760 

AATATTTTGT TTGACGTTTG TTTCTTCAAC TGTTGATTCA GTGTTTTTTT CAACTGATTC 5820 

GTCTTTATTT GTCATTTTCT GTCCTCCAAT ACTTTCTAAT CCATCATTAC CAAATTCTAT 5880 

TTAATAATTG AATGACATTT TGATAATGCA TAGCTGTAGG TCCAATCACA GCGATTTGAC 5 94 0 

CTTTTAACGT TTCATCAAAA TGATATTGAC TTGTTACAAT .TGAAATATCA CTTAAGCTGT 6000 

CATCAATTTC ATTAC CAATT TTTACATTAA TATTTGGTGA AGATATATCT TGTAATAATT 6060 

CTGCAATTCT ATTTGATTCT ATATATTGTA GAATGGGCTG AATTGAAGAT ACATTACTTT 6120 

CATTCAATGC ATCAATAAGT TTAACCTTTC CACCCATATA AATG CTATTA CTTTGATTAG 6180 

30 AAATATGATT ATTCATCGTA TTTAACAATT TATTGATAAA AATTTCTTCC TGCTCTGATT 624 0 

GAaCAAAAGA GACAATATCA TCTTGTAAAT TCTGATTAAA CTCAGTTAGT TTGTTTGTAA 63 00 

CAAAATTTGA TATTGTATTT AGTTTGTCAT TATTAA 6336 
(2) INFORMATION FOR SEQ ID NO: 220: 



20 



25 



35 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13059 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRAND EDNESS : double 

<D) TOPOLOGY: linear 



4$ (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 220: 

TTCATGATTA TTATCTGTTG TAGACACTGC TGGATCTTCC GATGTATCTT TCGATGCATC 60 

TTTCGATTTG TGTATTTGCT GATTCAAATG GTCTAGGTCT TCTAACGCCT TATTTACCAT 120 

TGCTTCATCA TTTTTATCAT CTTTTTCTCC ATGTTTTGTT GTAGCCGTTT GTGACATATC 180 

ATTTTTCATT GCATTAAGAT CGTCCTCGCC ACTTTGTTGA CCCCTATCAA CATTTGAAGA 24 0 

AACCTCATTT AAATCTTTAA GCAATTGATC TAATTTACTG TCTATATCAC TTTGACCGTT 3 00 



SO 



55 



BNSOOCID: <EP 07865 19A2J_> 



972 



EP 0 786 519 A2 





TTCATCTATT 


TGCGATGCTG 


TTTTCGCTTC 

A A A * WWW A A Xr 


ATTTAGTTGT 


GCTTTATAAT 


GTTCTTTAGA 


420 


5 


TGAAGCCGAT 


AACTGTTTTA 


ATTGCTCAAT 


TTGACGAATT 


GCCTTGTCAA 


CTTTGTCTAA 


480 




TAAATCTTGC 


TTAGATAATA 


TCTCTTTTGT 


AATTTCAGTA 


TCCTTTTCAG 


ATGCAGCTTG 


540 




GGCATCGTAC 


GGCAAGATAT 


TCGTTAAAAT 


G AT ACTTGT C 


GCCATCATTG 


TCGAACACGA 


600 


10 


TAACTTTACA 


TATAATTGAA 


ACGGTTTCCC 


TCX5ATATTTA 


GCCATCAACA 


T A CT C CTT C C 


660 




TfArTTAPTT 

X W^^W X X W X 


CCTTCAAAGA 


ATTACATACT 


ATTATATACC 


TGTTTACAAG 


AAATTTACAC 


720 




TTATC*TATCT 

X l/Vl W 1A1 W A 


AGTTATTGTT 

«»>J X X *» X X VJ X X 


GTTAGTAATT 


ATCTACTTAT 


T A CTT AG CTT 


ATATTTAAGT 


780 


15 


AAAPAAAAPA 


AGCATGACGT 

JWJV f\X wlW X 


AATATCATAT 


TGTCCATGTC 


GCTAACATCA 


TATTACGTCA 


840 




>W<X w 1 X X X.MX 


ATT A A ATG AT 


xxx inx xxx 


AO APTY3 CTTTT 


TTCCTTTTAG 

X X WW XXX XX^Vrf 


CTTTCGAGCG 

w xxx VvVjnw^iw 


900 






a a t' * r i 'nrTff? 

<U\V X X V3 W X V— 


AATTGTTCAC 

X X VJ X X wlU 


GCRAf3ATTTC 


GTGTGCATGT 


GCTTTTTGTG 

x x x x x x 


960 


20 


f*raaTi a a fir* 


ATCITrt A A A C* 
i\ X w X wVJMMMw^ 


X VJ X X w X X \JJ\ X 


PTTTf'AAACT 


TTrTAAPATT 

X X W X X X 


TGTATTAATT 


1020 




VM X V. X X lAv. X 


X X WwJ"VX X \J X X 


ATPTPATPAT 
t\ x V— • x wrvx w<nx 


TATGCTCAAA 


T AAGTG CT CT 


GATAATGTTA 


1080 


25 


^TTTAfJf ATf3 


OTGTGf^GGTT 

\J X w X \JW\Jw X X 


TGACGATAAC 


CTAAAATCAA 


CAACTCATAG 


TCAAACX3CTT 


1140 




rsTTr^r* a ccrzc 

\J x lULnLLUV. 


ATTT A A A ATT 
aX X iivvinl X 


X Vrt X XftWWW X 


CATTGATATC 
V— x^ x x x ^» x v. 


AAGATAAATA 


TCACATAACT 


1200 






AX X X^^WWW X VJ 


TCAATATTAA 


TAGATGGGTA 


TAAATGCACA 


TTAG CAT ATT 


1260 


30 


Vj*%X wAAw X X v» 


WftX lAVJv- X Xrt 


TrAGACATrT 


(1TGTAATAGC 


AGCGATGTGn 


AACTTAAAAT 


1320 




PTfiGTAAAC; r. 


TvCAACCAAT 


ACCTTGATGT 


TACG Aa t TGa 


TCCgAGTTAG 


TTAATATTAC 


1380 




AATTTCTTTA 


GTATATCTAT 


TACGACTACG 


ATAGTTATAT 


AGATATCCGC 


CTTGTAAAAT 


1440 


35 


ACGAGATTGA 


ACCTTTG CGT 


CTGCTATATT 


GAGCATCGTT 


TCATATTCGT 


TTTTATCTGG 


1500 




AATAATAATA 


TTACAATGTC 


GTTT CAT AT C 


ACCTTTACAC 


ATCAATTGCA 


TATTTCCCGG 


1560 


40 


GACATTACCA 

\JXXW%X X>X^WW^& 


TTA PAOTf^TT 


CTTGCCATAC 


CAAAACATCA 


CTACCTTTTG 


ATGGCAAATT 


1620 




ATATAACACT 

4» X X J^^k W^W A 


GAAAATGGTA 


GGGCTAGTGA 


GTTAATAACG 


AAATGATGTT 


CCGTAATTTC 


1680 




AAGTTGCTTG 


ATAAAAAATA 


ATGCGAATGC 


GAGCTTTGAA 


GGGAAAAAGT 


AAGACTTCCC 


1740 


45 


TTGCCAATCC 


AATATGACAT 


CAGATGTTAC 


AAAATTTTCA 


TAAATCACTT 


CTTTACCTTC 


1800 




TGCTGTCATA 


TATTTCTTCA 


AGATCGCTTT 


ACX3ATTTAAA 


TCGTAAACAG 


TTTGTGCAAA 


1860 




TTTAATACCA 


TTCTTAGAAT 


AATAATCGAC 


AAATCGGACA 


CX3TTGTTGGT 


CATCAAACCA 


1920 


SO 


TTCGACACGA 


CTAACAATTC 


TAGGGCGCTC 


TCCACTTTGA yAAAAT ATTT TACCTCGyAG 


1980 




ACGTCCCATA 


TCATTaATTG 


TAGCCGAATT 


GTTGTTACCT 


TTAATTTCCC 


AAAAAGCTGG 


2040 




TACAGTAACC 


TGATTAAAAA 


ATCGTGGTTT 


CATATTTTCT 


GTATTATGAT 


TATCTGCAAA 


2100 
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50 



TAAATCTTCT 


TCCAACTTAC 


TGGCTTTAAA 


AGACTCATAT 


AACTTTCGTG 


AATGATCGTT 


2220 


AAAGTAATCA 


AATAATTTAA 


TCATGTAGCA 


CCTCTTGaAC 


TAATGTTTCC 


CATTTTAAAA 


2280 


TAATATCTTG 


AGTCATAAAT 


TGCTGTGCCA 


CTTCATAAGA 


GATGTCATGT 


GGTGTCTGGG 


2340 


GACCATTGTT 


AAAATACATT 


ACAATGGcAT 


GAGCTAGTTT 


TGCGATAACA 


TCATCCACAC 


2400 


TATCTTCGTC 


GGTATCAAAA 


GGTACCAAGT 


AGCCATTTTC 


CCCATCTCGA 


ATAAAGGTTG 


2460 


GGTTACCATA 


ATTCACATTT 


AATCCAATCA 


TACCTAGTCC 


TGAGCCTACC 


GCTTCCATTA 


2520 


GTGTTAACCC 


AAAACCTTCG 


CTAGTTGATG 


CAGAAAGAAA 


TAACTCATAA 


TCATTATAAA 


2580 


TTTCATCAAG 


TTTAACATGC 


jCCTAGTAAAC 


GAATATAATC 


TTGTGCGCGG 


TGTGTATCAA 


2640 


TAATTTTACG 


CAGTCGCGTC 


TTCTCGCTAC 


CTTCTCCATA 


AATATCAAAT 


GTTAATTCTG 


2700 


GCACTTGTCG 


TTTAGCCACG 


ATAACCGCTT 


TGACAAGCCA 


ATCAATATGT 


TTCTCATTCG 


2760 


CTAAACGAGA 


TG CACTAATC 


ATCGCATATG 


GCTTTCTTGA 


TAATGTTGGA 


TATGATAATG 


2820 


CATCAATGCT 


TCCCACAGGA 


ATAGTATAAA 


CACGTGGGCG 


ATAACCTTGA 


TATTGCTCAA 


2880 


ATTGTCGACA 


AACCATATGA 


TTTTGAATAT 


CTGTTGCTGT 


AATAAAGAAA 


TCAATGTATT 


2940 


tagcttttga 


AAATTGATAT 


T CAT AAT AAT 


TGTTCCATAG 


TATATGCTGC 


TCACTCATCA 


3000 


TATTATTACT 


ATAATGATCA 


GCATGAATCA 


CAACACCAAC 


TTTACTATCA 


CCTTTATGCT 


3060 


GCAAAACAGC 


CTGACCAATA 


TCAGAAGCGC 


GGTCTAATAT 


GACAATATCG 


TCTCGGGTTA 


3120 


AATTCAATCG 


TTGTAAAAAG 


TATGCAATAA 


ATTCCGTtTT 


GTTATACAAC 


ACCGCATCTT 


3180 


CAAACACATA 


TATAGAGCTG 


TCTCCATCAA 


TATATTCGTT 


ATAAGCGATG 


GAACCATCTT 


3240 


GATTATAAAA 


TTGTCGCATA 


TATAATTTCG 


CTTTATTATC 


AGCTGGTGCA 


TAATACTCAG 


3300 


AAAATATGCG 


CGTATAACTA 


TAAAAATCTT 


TACGTACTAA 


CATACTATTA 


ATTACAAATT 


3360 


CTGCftCGATC 


CACAATATCT 


TTTTGTTCAT 


TTTGCAGATA 


ACATGTTACA 


AATGATGATT 


3420 


TCCCATTAAA 


ATATAGGCGG 


ACTATCTTAC 


CATTTCTTTC 


TCTAAAACTA 


ATGTCATGAC 


3480 


CAAGCTCACG 


TTCAATGTCA 


TCTAACGTGT 


ACGTTGTTGG 


TGCTAAAGAA 


ATATCACTAA 


3540 


AATACTGATA 


CAACCAAATA 


ACTTCTTGAT 


CTTTAAACCC 


AATGTTTTGC 


GTTAATGTCT 


3600 


GTATGTTCTC 


TGACTGTATA 


AAATCTAAAA 


ACACAAATTT 


AGTGTCTTGA 


TTTGTACGTC 


3660 


TCAATAATTT 


AGCACGGTAA 


GCTTGTGCAT 


ATTCAACACC 


GCTACTCGCC 


CAGCCTATAC 


3720 


CAAAGTTTAT 


ATTATATATT 


GTCATGCGCT 


ACCCCTTTTC 


ATTTATGGAA 


AATGTATAAC 


3780 


TGGCATACCC 


TCTTTATCAA 


ATGTAATCAT 


GCTTTGACAA 


ATATTTTTCA 


CCATTCTTTT 


3840 


TTTGATATTT 


CGTGTCATAA 


CTTCAAATGA 


ATCTAAGGCA 


ACTCTATGGT 


ATTCAAAAAT 


3900 
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1$ 



20 



GACTTGTTCT AACCAACATG AATCAATTGC TTTCAAAAAG ACTTTTTGAA CGAAAATATT 4020 

^ ATAATAATAT GCACTTTGCA TGTTTTTACG ATTCAAAGCT AATTGCTTTT CAAATTGCTC 4080 

TAATAAAAAT GTCACTACTG CTTGCTTATC TTTAAAATTA ACACAAGCCA CATCTTTATT 414 0 

AAATTGGAAA CTTAAATTTT GATAAATATA CTCGACAACA CGCGATTTTG TTAGCACCTT 4200 

w TTCCTCATTT ACAAACATTT CAAATACATC TTTAGCTAAC GCTTTAAAAT CTTGATTCTC 4 260 

AG CATCATCT ATTTCTAAAA CTCGATTGCG TTCCTCGTAT ACAAGATCTC GCTGTATACT 4 320 

AATGCTTTTT TCAAATTCAT TAGC CATTTC ACGAGCTTTA ACCCCTTGTT CTTCCGAGAt 4380 

aCGcTGCGCT TTAACTACAA TTTGCTTAAC TTTGCGATTA AACAAATTAC TTTGCGATAA 444 0 

TCGTTGTGCA TCTAATGAAT ATAATTGATT ATTTTCCGCT AAATTACTAT CGCTCCATCG 4500 

CTTAACTAAA TAATCATCTA GTGAAATATA TATACAAGAT GATCCCGGAT CCCCTTGTCT 4 560 

ACCAGAACGA CCACGTAATT GCCTGTCTAC ACGGCTATTT TCCATATGTT CATGAATAAT 4620 

AACAGCTAAT CCACCTAATG CTTCGACACC TTCACCAAGT TTAATATCTG TGCCTCGACC 4 680 

2$ TGCCATACTA GTCGCAACAG TCATGGAACC AATTTGCCCT GCTTCAGCTA TCATCTGCGC 4 74 0 

TTCTTTTGCA ACATTTTGCG CAATGAGTAA ATTATTAGGA AT AT C CATTT GGAATAATAC 4 800 

TTTCGAAAAG TATTCAGCCG CTTCAGCAGT TCTCGTTATG AGTAAAACCG GTCGCCCCGT 4 860 

30 TTCATGAAGT TCAACTATAT CATGAATCAT CGCGATGTTT TTCTCATCAA CTGAACGAAA 4 920 

CACTTTATCT GGTTCATCGA TACGTTGAAT CGCTTTATCA GTTGGTACTT GTACGACTAT 4 980 

TTTTGAATAC AAATCAAAGA ACT CTG ATTC GCCTAATTTT CCTGTAGCTG TCATACCTGA 5040 

AAATGATTCA AAAAGTTTAA ATAAATTCTG GAAGGTAATT GTTG C CAT AA CACTTTTATC 5100 

TGTTGAAACC TCCATACCTT CTTTCGCTTC AATAGCTTGG TGAAGTC CAG CTTGCAACTT 5160 

AGTTCCCGGT AACATACGAC CTGTAATACG GTCAATTAAA ACAATATCAC CATTATATAC 5220 

AAAGTAATCG ACATTAGATT CAAACAAATA TTGTGCGCGC AGTGCTAAAT TAATATTACG 5280 

CACTAGGACC ATCGCTTGTT CGCTATATAA ATCTTCAACA TTAAAGTATG ATTGTGCCGC 534 0 

45 TTCAATACCT TGATTTAACA GCCATATTTC TTTTTTGGTC TTCTTCATTT TAAAATGCAC 54 00 

GTCTTCAATC AATGTATCTA CAAACTCTTT CACAATATGA AATAGATTTG ATTGTAATCT 54 60 

TGGTGCACCC GAAATAACTA ATGGTGTTTG AGCAGCATCT AAAATGATTG AATCCACTTC 5520 

50 ATCAATAATA CCGTAATTTA ATTGTGGTAA AAATTTCCCT TCCGCACTAT CAGCCAAATT 5580 

ATCAATTAAA TAATCAAAAC CGAGACGTCC ATTAGTTGTA TATATAATAT CATGTTCATA 564 0 

TATATTACGT TTTTCCCCTT TTTGATACTC ATAATCCACA ATATCAACAA AACCTAATGA 5700 

55 



35 



40 



97S 



EP 0 786 519 A2 



5 



10 



75 



20 



25 



30 



35 



50 



TAATLA 1 I\-vj 


^*TV*^?A 7\ H " 1 ' TV iv 

I rGT AATTAA 


ATATGTTCCT 


TTTCCCGAAA 


GAGCATTTAA 


ATATAAAGGC 


5820 




1 lAAlbl ITT 


ACCTTCGCCT 


GTTTGCATCT 


CCGCAATGTT 


ACCTTCATGC 


5880 


AATACAA I uG 


L l LCGAi l AA 


CTGAA^l i d 


TTAGGATACA 


TACCTAATAC 


TCTCCAGCTC 


5940 


G CTTCACGTG 


CCACTGCATA 


AGCTTCAGGT 


AACAATGTAT 


CTAGTGTATC 


AACTCCTGAT 


6000 


G CTAAACGTT 


CTTTAAATTC 


TATTGTCTTT 


TGTTTTAACG 


CATCATCAGA 


ATATGATTTA 


6060 


ACTTCATCG C 


TCCATGTATT 


GaTGsGTTcA 


CTATTTTTCT 


AATCGACTTT 


AGTCTTAATT 


6120 


CGTTTATCGT 


AACATCTAGT 


TTATGTTTCA 


TTTACTTCCC 


CACCATTCAG 


TTTCGATACA 


6180 


TCTAAGTAAT 


CTAAAAATCG 


TACTGGATTC 


ATTAAACGTG 


ACATATAATT 


TAGATGTTTG 


6240 


TCTTGCTCTT 


CTTTAAAATA 


AACCTCGACA 


TTTGTATCTT 


TTAGTTCATG 


ATTTCCTGGG 


6300 


ACATGTTCTG 


TAAGCCATCC 


TTTTAAATCA 


TCATCTTCAT 


GGCTTGTACG 


ATACACTTTG 


6360 


CAACCCAAAT 


GCTGAGCGAC 


ATAAGTTGCA 


AAAACATTTG 


ACTTTGACCC 


ATAACTAATC 


6420 


AAATTAATAG 


CCTTTAGGGT 


ATCTTGACTT 


TGCAAATCAT 


TCTTTAGTTG 


CTTAATATTT 


6480 


CCCTCGATAT 


TGTCGTCCAT 


CCAACGTTCA 


ACGAG CCAAA 


CATGACCAAA 


CAGTTTCAAA 


6540 


AAATCATTCG 


AAATAGTTGG 


ATAGGTGTCA 


GATGGTTCTG 


CAATAATGAC 


ATTGATCATA 


6600 


TCATTTCCAT 


ATTGGTCATC 


GCCTATCTTC 


GTCACCCGCA 


TGCTTTTATA 


CTCTAAATCA 


6660 


TATTGATGCG 


TCATCTCTGT 


GATTGTTAAA 


CATCTAAATA 


TAAGACTCGT 


CGATGCTGCA 


6720 


TTCATCATTT 


TTATTTTATA 


AGCATAGGCk 


TCATCAGGAT 


ATTGAATCGT 


AATACTATTT 


6780 


GACTTTACAA 


TCTCAGTACT 


TAGTTTTGTG 


CCATTnTAT 


TATAAAAAAT 


GATGATAAAA 


6840 


TACACTGAAC 


CAGCAGGCGT 


TGCATCAAAA 


TCAAAATGCA 


ATTTATAATG 


CTGTCCTCTA 


6900 


CGCAAAATTG 


GkAAACTTGG 


CGcAisrrri'A 


TATTTTGAAA 


ATTGCTTTAA 


CATCAACCAC 


6960 


TCATGAATCG 


GTAATCCAGA 


GGGCATCAAA 


GGATTTATAA 


AAGTCACTTC 


ACCATTTGAA 


7020 


AATGATACTT 


TAGAGCCATA 


CATAAATGTA 


GTTTGTGAAA 


TATAATTCCA 


AGTAACTTTA 


7080 


AATUl ITIZIVT 


TTTTCAGCAT 


GTTGAACTCT 


CCCAAACTTG 


TCTTCCAAAA 


TAATGTTGTA 


7140 


AAAATTAACA 


AACCAACTTG 


CAATGGTAGG 


TGAATCATCA 


TTATGTCGCC 


CAGGAATACT 


7200 


GCGATTCATC 


ACTCTTGCTT 


GGTGTGCTGT 


CAATACAGGT 


AAT AG CTCTT 


GAAATGCATG 


7260 


TGGATCATAA 


TCATCATGTT 


GCATATATGC 


TATGGCAAAA 


ACAGTTTGTG 


ACAATGATTy 


7320 


CTTTTGAAAT 


GTTTGCGAAA 


ATTTTTGATT 


TAATGCCTGT 


ATCGACGCTT 


GAGATGTATC 


7380 


ACCTTCATTA 


GACACCAGGA 


CGTCTAATGC 


TGTACCGAAC 


TCTTCTGGTC 


TAAGTAATCG 


7440 


CATATGTTCA 


GCAATCGTTC 


CAATATTAAC 


AAGTGGTTTA 


CCAACAATAA 


TTGCCTGAGG 


7500 
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TAATTCATGT GATTTAAAAT TCAGCTTTTC TAATGTCTCG TCAATAACAT TGATAATACC 7620 

TTGTTCATAT TCAGATGAAC CGATATAAAA ACTACCACCT TCAACACGAG GATCGCCGAT 7680 

5 

AAGTAAAAAC GGTGCATTCA TACGTTTCAT CATATAATAT CCTTCGAAAC CTTC CGCTGT 774 0 

TCGATAACCA CTAAAATATA CGTTTAGTGG CGGTTTCATA TCACCAGGGT GGAAATAATA 7800 

AATAAATTCC TGTCGTTGAC TATCTACGAA ACGACTACCA CCAAGTAAAA ATTGACCCAT 7860 

10 

GTCTAATCTA GACCAT CGTT TGTGTATAGG TCCTAAATGT ACCGTCCCGT TCCCACGCGC 7 920 

CTTAACAGTT ACACTTATAT AAGCATCAAA TGGTTTCGCA GGTATCTCTA AAGGACTGTC 798 0 

1S TAACATATCA TCAGTCAATA CGATTTGTTC AATTAATGCA CCATCAGCGC CAGTCTGAAT 8040 

CAATCTAAAT GTATATTGCA ACTCGACCGC ACCATCAATA TCAAATTCTG GCCATATTTG 8100 

AATGACTTTA TCTTTATCGT AAACGAGATT ATTTTGCCAA GATGCGATAG GTTTAAATTC 8160 

20 TTTCCCAAAT TCTCCACTCA ATGTGAGCTC TGAATTACCT TGGTAAACGA CATCTCCTTT 8220 

AAAATTCGGA TGCACAAGTG CTAACTTAGG AGAAACCTTA TCTCCATACT GTCCTGAGAA 8280 

GCTAACTGCC TCTAATTTAT TATTACGTTC TTCAATATTC CGGTAATGTA ATGGTTGAAC 8340 

25 AACGTATTTT TGGACATTTT CGTCTTGTTC ATATTCAACT GACCAAAATG ATTCATCAAC 84 00 

ATACGTATTG TATGGTTCGC TTATCATTTG TAATAAATTC GTTAATGTCT CCGAGTATGG 8460 

TGCTTGAATA TAGATAAAAT CAAAGCGCCC TTCTGCTTCA ACAATCGCTT CAATAGCCTC 8 520 

30 

TACATAACCA CTATCAAATT CAAACAATCC AATATCGAAG TAATCCCAAC TCACACCTTT 8580 

TTTGTGTTGA AAAATAGGTT CTAAATCGTC TCCTCCAATT TGCAAAACTC TAAATTTACG 864 0 

35 TGGCATCATT TTCACCTTCT ATTAACTCAT CGAGCTGATT AATAATATTC TTAGAAGCAT 8700 

ATGCATCTAT TAATTTTAAA GAATAGGCGT ACGCATAATT CCAATTTTTC AAATAAAATA 8760 

AATAATAATT TAACGCATCA TCTAATTCAT CAACTGTATT TATAATACGG CCATTGTCAT 8820 

40 AATCAGAGAC GTAAT CTGTT TGTTGACCAT TAATTTGTGG AATCCCAGCG CTAATTGCAC 8880 

TAATTTGTAA ATACAAGTCA GGTTCTTTTG ACATATCTAT CACAAGTCGC AACGTCCGCA 894 0 

ATGCTTCTAC AACATCATGT TCAGCATGTA TCGTCTTAAC AGCAATGATG TCATCTTGAT 9000 

45 

CTTCAGGTGT CATTAATGCT GAAACATTAA CATCCGCATT CTGTTTAGCT TGGTATTCCT 9060 

CATTTACCGA CGTAATACAT TCACGAAGCC ACATCGGTAT GTCATTTTGA TGGCGCGATA 9120 

ATAAAATTAA ACGGTAATAA TCTTCCTGTG CGATATAATC CACAAGTCGT TGCATCATTT 9180 

50 

GTTGCAAATC AGCGTCACTC ATACCATCTA TCCATACACC TATAAATGTT TCCATCAATT 924 0 

GACTACTTAT ATTAGGTGAT TGTCTCGTTT CAAATGGTGT GATTCGAATC ATTGTATTCT 9300 
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TTAAATGGGC 
TTTTAAAAAA 
GCCTAGCATC 
CTTGAAATTT 
GTTGATATCT 
CTCCATTAAT 
TCGCTGATAA 
ATTCTTCAAA 
CACTCGTCAC 
TTAAGTGATG 
ACACAGACGA 
GTGCATGATT 
AACTAATCAT 
CTTGCCACCA 
TACCAATACT 
TCTGCAATAT 
GTAGATAAAT 
AATGCCAATC 
TTACCAGGTT 
TTAGTATTGA 
ACTGAAATAC 
TTAAACATAG 
ATCATTAAAG 
GTTGCGGAAA 
AATAAGATAA 
GCATCTATAT 
GGCATTGGTC 
GTTCCAGTAA 
GAAACATATT 



ATTCTTTACG 
TGAATAACTT 
TGAAGCCACA 
TTCTTCAATT 
TTTTGAAACA 
CGTTAAATAT 
ATAACCTCTG 
CCAAATTGAA 
ACATTTTAAT 
ATAATTAATC 
ATACTTTGTC 
GAGAACAATC 
ATCGTCAAAT 
TCGTTGGTCA 
GGTTTAAAAA 
TAATACTGAT 
GCGGTACAAA 
CAAACCAACA 
TaACTCCTGA 
TTAAAAATCT 
CTACTGGACT 
ATAAAATAAA 
TAATACTGCC 
CGTTCATTAA 
ACAATGTGAT 
ATTCCATTTT 
CTGCGATGCC 
CCAAAATCAA 
CATGAATCAC 



ATAGATTGAT 
AATGATTTCG 
ATCACATGAT 
AGTTGAGCCA 
GTGACTCTGC 
TCTTGGTAAG 
TCATCAAAAA 
TACCCTTCTT 
AAATACGGTG 
GCTTGTGGCG 
TCATATAAGT 
AGTTGATAAT 
TCCGTCTTAT 
TCGTAC CAAG 
TGGCTTATAT 
GTAAACTAAT 
CAATGTGAAA 
TACGCGTCGT 
AAAATAATTG 
CGATAAAAAA 
ATCAAATGTC 
ATGAATGCCA 
TGCAGGGTTA 
ATCGATATAT 
TATCACAAGG 
TTGATGCATC 
GTAGCGACTA 
TATTGTTAAG 
AAAATAACTT 



ATTCCTCATC 
CTGGAATATG 
CATCTTCATG 
TATTGTTATA 
CATTTTTCAA 
AAGCCTCTCC 
TATAACGCCG 
GACTAAAATA 
TGTACACAAA 
CATGGTGACT 
CATATCGATG 
CTAAGTCATT 
TTTGTAGTTG 
CTGGAATAAA 
TTATCAAAAT 
ACAATCAGTT 
TAAAGCGGTA 
GCTTGATAAT 
CCACTCTTTA 
TAACCCAATA 
AGCATTGGCA 
CTTTTTAAGA 
ACTTTCCAAG 
GGTATTCTCA 
ATGATTAACA 
ATTGATTTAA 
TTTTTGTCAG 
TAAATATTGT 
TGAATAACAC 



TGACACAGTT 
ATTGGCTATT 
TATTTGTTGT 
TTCTGTTTGT 
ATCTTCATGA 
CTGATCATCA 
TTGTAACTGA 
AATATTTGTA 
CTCAACATCA 
GAATCCTTGA 
TAAAAATGTT 
TTCAAGGTGC 
ATAATACGGC 
GTATTTCATA 
ATAAATATGT 
GTACTGAGaA 
TACCAATAAT 
TTAAATAACG 
AGAAATCTTT 
ACATTTGAAT 
TGTCATCTGA 
AAACAAAAGC 
ATAAATAAGA 
CTTCTACTAA 
ACGCAATCAC 
TAATACTAAC 
CTAACCAAAC 
CTTGATGAAC 
TTAAAATTAA 



TCATTTCTAT 
TGTCGATTGT 
GCAATCATTG 
TGATAGTGAT 
AGTACACAAT 
AAATAACGTA 
TCTCTTTCAA 
TAGGTCTGTT 
TCCGGCCATT 
ATTTCATCAA 
CTTAAATTTG 
ATTCCCATTA 
ACAGTCGTGT 
ATTACCTCCT 
ACGAATTGTT 
ATAAATTTCA 
GACTGTAACT 
TTCTGT AT C C 
GGATTTTTGT 
CACTAAATAT 
TATGCTTTTA 
TGAAATACTC 
TTTCATATTT 
TTCAATAAAT 
AATATGACTT 
CATTACAATC 
TAATAACATC 
ACGTTCTTTC 
TGTTAAGATG 



9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
1014X) 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10960 
11040 
11100 
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GAAATCAGCA TCAAGATAAT CATTGATGTT AACCACGGAC CTAAtCCTAA AGTGAAAATG ~ 11220 

TTTAAAGTAT TAACGTCTCC AC C CAT ATT A GAAATAGCTA TTTTAAAAAA TGACTCATGT 11280 

TTTACTTGCA T ATCGTTa T A GGAAACGATG GAAATGTTTG TGCCTAATAT ATAAATAaAC 11340 

AAGATAAAAC ATGTGTATAG CATACGTTTA TATATAATTT TATATTCGTA TTGTTGTAAA 11400 

AGTTTTAACA TGTTGCACCT CTTTTATATC AAAAACATTA AAAAGACTAA GGGTTCATCA 114 60 

CTAATTATTA AAATCCTATA TCGATTTTTC TAGTGATTGG TGCCTCAGTC TTTTTAATTT 11520 

TAGCCAGCTA TAAATTCAAT TTATGCTTGA GAATCATCTT GATCATTTTC ATCTTTCTTT 11580 

TTCTTTCTCT TCATTAAACC TAAACCAACT AATAATGTCA TAACGCCACC TAGTAATCCA 1164 0 

TTTTGTTTTA TTGAGTCACC TGTATCTGGC AATCTTTTTT CACTTTGTGC TGGTGTGCCA 11700 

TTATGTTTAG TCACTTCAGA TGTTGCACTT AATGTAGACT GAGATTCACT CGTGCTCGTT 11760 

20 GTTGCTTCAC TTGATAAGCG AGATGTGCTC GTG CTGTGAG TATGATGCAT ACTCATTGAG 11820 

TCTGACGGAT GCATTGAGTT AGATTCAGAT GTACTTGTTG AGCCGGACAT ACTTGTTGAT 11880 

GTTGAGTCAG AAATGCTTTG TGAACCAGAC ATAGATGTAC TCAGTGATTC GGATGTGCTT 11940 

25 GTCGAATCGG ATGTGCTCAA TGACGTTGAT GTGCTTGTTG ACACTGATTC TGAGTCACTA 12000 

ATTGATGTTG AGTCGGATTT GTCTTGTGAC ATTGAAACAC TCGATGAATT AGATTCACTC 12060 

ATTGATGTTG AGTCAGATAC GCTCGTTGAA CCTGAACCAG ACGTACTTAA TGATTCAGAT 12120 

ATGCTTGTTG AAGTTGAACC ACTTGTTGAG TCCGATGTAC TTGTCGATGT CGAGTCTGAA 12180 

TCTGATGTAC TCAATGATTC TGAGTCACTG ATAGAAGTTG AATCACTTGT AGATTCTGAT 12240 

TCTACTGTAC TTTGTGAACC ACTGATACTT ATTGAAGTAG AATCACTGAT ACTGTCTGAT 123 00 

GTTGATAATG ATGTCGACAC CGATGTGCTT TGTGATGACG ATGTACTAGC ACTCATTGAC 12360 

ATTGATGTTG ATATCGATGT ACTTAAGGAA CCAGATGCAC TTGTACTTGT TGACTGGCTT 124 20 

40 TGTGACATTG AATCACTTAA TGATGTAGAT GTGCTTGTTG AGCTCGAGTC ACTTACACTT 12480 

GTTGAACCTG ATATTGAGTC ACTTAAACTT GTCGATGTTG AAACTGAtwC GcTTCCGCTC 12540 

ATTGAGTCAG ATGTTGAAAG TGATGTACTC GTTGAATTTG ATCCACTGAT GCTAGACGAA 12600 

45 TCACTTGTAG ACATTGAGTC GCTTTCTGAT GCACTGATGC TCATAGAGTC AAATTGACTA 12660 

TTACTTGTTG AGCTTGACTG CGAATCGCTC ACACTTGTTG ACGTTGATTC TGATCCACTC 12720 

ATACTTTGCG AGCTACTCAA TGATTTTGAA TCACTTAATG AATCCGAAGT GCTAAGACTT 12780 

SO 

GTGGAACCAC TTAAAGATAT TGATCCACTT AATGAGTCGG AGTCACTTGT ACTAGTAGAA 12840 

TCACTCATTG ATATTGAATC ACTTAGcGAG GTAGACTyGC tTACGCTTTC TGAACCACTT 12900 
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TTTGAAT C AC TTAATGAATC AGATTCACTC ACGCTTTCTG AACTTCTTAG TGACGTCGAT 
ACACTTAATG ATGACGAATC GCTTGTGCTT ACTGAATCG 
(2) INFORMATION FOR SEQ ID NO: 221: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10758 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 221: 
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AALLbvjvjriftA 


ACCCTCCAAA 


AC C CATT AAA 


AGGnTGGnTA 


60 


r*f~*t *' i' - !" I ' D. & & a 

UW^l X XJ"W"U*U"l 


th/it An r* A TT 

XVjOXJ-IVTwaX X 


T* a a r*r*c*r*f^ a 
x MALLuLLAL 




GGGTGGTTTA 


TTCTTCCGTT 


120 


ATTTAAATTA 

rtX X X^W%X ±J% 


GTACACCATG 


v— r\wV-i x iLlul 


ar'TTr'a/mr 1 a 


TATTTTAACG 


AAAGCTTATT 


180 


AGCAACTGAT 


AAAAAAATAr 




A ^ *^ a ^n^p^^ ^^^^ 
AiAlAl luL 1 


I uATCjVjAAGG 


ACATCGAGCC 


240 


GGCTAAGAAA 


ATAHAATTTA 


a a atta a a a a 




*TW* ft IV 7\ nv» 

1 CjCjUATGATG 


GTAATGAATT 


300 


GAAAATTGAT 


>J*» x x uvjn xxx 


ATTrAATTfiA 
r\ x x X X vjltV 


/VJ 1 V 1 InOV. X 


A *.f*A HP** T 
AftLAAwViuri 


AC vaAAGGTG C 


360 


TTATTATCCA 


AGTGTAGAAA 


ATATPPAAnr; 


TfZrYIZV A An AT 




ft 7t 9A 7t 7t orrv^ Jt 


420 


TCATATTAG C 


GGATTGAAGA 


AAATAGATGA 


fTAPArTATfi 
X nWW, inlu 




TTP 11 T'ft ft 74. ft ft 

1 XUATAAAAA 


4 80 


ACAAGAAAAT 


TACTTAACAG 


f5 A TTT ATT A C* 

XXX £\ X X 


X \j\inww X X X n. 


IT A h/^THHai 
X iAAulAAnn 


AATATTTATC 


540 


AGATGTACCA 


ATTAAAGATT 


TAGCGAAATC 


AGATAAAATC 


CGAAAATATC 


CTATTGGTAT 


600 


TGGACCGTAT 


AAAGTTAAGA 


AAATCGTTCC 


AGGTGAGGCT 


GTTCAACTCG 


TTAAATTTGA 


660 


TGATTATTGG 


CAAGGTAAGC 


CTGCACTAGA 


CAAAATCAAT 


TTAAAAGTTA 


TTGATCAAGC 


720 


GCAAATTATT 


AAGGCAATGG 


AAAAAGGCGA 


TATTGATGTT 


GCGAATGATG 


CTACCGGTGC 


780 


AATGGCAAAA 


GATGCTAAGT 


CATCTAATGC 


TGGTCTCAAG 


GTATTATCTG 


CGCCAAGCTT 


840 


AGACTACGGT 


TTAATAGGtT 


CGTATCTCAT 


GATTACGATA 


AAAAAGCTAA 


TAAAACTGGT 


900 


AAAGTGAGAC 


CAAAATATGA 


AGACAAAGAA 


TTACGTAAAG 


CAATGCTTTA 


TGCAATTGAT 


960 


AGAGAAaAAT 


GGATCAAAGC 


GTTTTTCAAT 


GGTTACGCTA 


GTGAAATCaA 


TAGTTTTGTA 


1020 


CCATCTATGC 


ATTGGATAGC 


AGCCAATCCT 


AAGGACCTAA 


ATGATTACAA 


ATATGATCCT 


1080 


GAAAAAGCTA 


AAAAAATCTT 


AGATAAGTTA 


GGTTATAAAG 


ATAGAGATGG 


TGACGGATTT 


1140 


AGAGAAGATC 


CTAAAGGTAA 


TAAATTTGAG 


ATTAACTTTA 


AACATAATTC 


AGGTTCTAAT 


1200 


CCTACTTTTG 


AACCAAGAAC 


TGCTGCGATA 


AAAGAiTiC u x l 


GGGAAAAAGT 


TGGCTTGAAA 


1260 
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AATACGATTC CTGTTTATAT GCCATATATC 
GACAGACCTT TAGTCGTCCC GCATCAATCT 
5 GAAACAGAGC GAGACACTGT ATTTACAACA 

GTTTATCAAT TACTAAATAT AGATCGTGGT 
CTTCGCGTCT TAATGGATGC CATATACGAA 

10 

ACTAAAGATT CGAAAATGCA AAAACTCGCA 
ACGTACATTG AGTCATTATT AAAAGAACAC 
TTTTATTTGG TGATTTCAAA TCATGAGACT 

15 

TTTCGTTGTT CCACTCTCAT GATTTTTTTG 
ATTTTGTTAA ACAAGTGATT GCAAACCTGC 

20 GACGATATTT TACAAGTCAT ATACAAATAA 

TAACATTAAA TTTACAATTA TAAGCGATAA 
AATGGAAATG TCGGTTACAG AAGT.CATTTT 

25 TTACGGCTTA AAAATCATGG GAGACGGGCT 

TATTTTAAAC AAATTTACAT CAAATCCAGT 
TATTTTAATA CAAAGTAGTT CAGGTACGAC 

30 

ATTTATGACA TTGAAACAAG CCATTGGAGT 
AACTGCATTT ATTATCGGTA TAGATTTAGG 
TGCATTCTTA ATCTTTTTCT TTAAACGCTC 

35 

CGGTTTCGGT TCACTATTCT TCGGTCTAGA 
ATCATTAGAT GGATTTAAGC AATTAATGCT 

40 CATTGTCGGC GCAGGGTTAA CAGCACTAGT 

ACAAGAATTT TATCAACAAG ATTTAATTAG 
CGATAACATT GGTACCACGA TTACAGCTAT 

45 AAAACGTGCG GCGCTTGTAC ACGTCATCTT 

TTTCTTGCCA GTTGTGATTC ATTTGATTAG 
AGCGATGACG ATTGCAGTAT CACATGGTAT 

50 

ACCATTTGTA GCAGGTTTAG CATGGATTGT 
TGATGACTAT AAACCTCAGC ACTTAAACAA 

55 



►0 786 519 A2 

ACATCTTATT TCATGACGCG TGCTATCGGC 13 80 

CAGAACTTAG CATTTATTGG TAACTTTGCA 1440 

GAATATTCGG TTCGTACTGC CATGGAAGCT 1500 

ATTCCAGAAG TCATCAATAG TCCATTTGAT 1560 

CTGAATGACC ACCAAGATTT GCGTGAGATT 1620 

TTAGCAGGAT TCCTTAAAAA GATAAAAGGT 16 80 

AAATTGTTAT AACGAAAACC ATTAATAGAT 174 0 

GGGACAGAAA TGATGTTTTC ATAAAAATTA 1800 

ATGAAACATA ATTACATGAT TGATTG CATC 1860 

CATTTCACAC TGAAAATTTA CATAATAAGT 1920 

CATATATTGT TAAATAATTT TACCTAATCT 1980 

TCTAAATATA AAGCTTATTT GAGGTGAAAT 2040 

CTCCTTTTTA GGTGGTTTAG GTATTTTCCT 2100 

TCAAGCATCA GCAGGAGACA GGCTACGAGA 2160 

ATTAGGTGTT ATTGCAGGTA TCGTTGTAAC 2220 

AGTTATCACA ATCGGACTGG TAACAGCTGG 22 80 

GATAATGGGT GCTAATATCG GAACAACGGT 234 0 

CGAATATGCA ATGCCAATTT TAGCATTAGG 24 00 

TAAAATCAAT AACATTGGCC G CATACT ATT 24 60 

ATTTATGGGT GATGCCGTTA AACCTTTAGC 2520 

TGATATGTCT ACAAATCCAA TACTCGCTGT 2580 

TCAAAGTTCA AGTGCGACGA TTGGTATTTT 264 0 

CTTAAACGCA GCAATCCCTG TGTTACTAGG 2700 

CTTAGCTAGT TTAGCCGGCT CAATCGCTGC 27 60 

TAACTTAATC GGGGTAATTA TCTTCACAAT 2820 

TTTGTTACAA GATTTATGGC ACTTAAAACC 2880 

CTTCAACATA ACAAATACTT TGATTCAATT 2 94 0 

TACAAAGCTT GTCCCAGGTA AAGATATTGC 3000 

AGATCTTGTT TAT CACGCAC CTGGTGTTGC 3 060 
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AGACATTCGC GAAATTACAA AAGACGATAA AAAATTGATC AAAAAGCTTG AACAAAAGCA " 3180 

TCAAGCTGTT GAAACAATCA ATG AT AG CAT TCGAAATTAT TTAGTTAGAA TTTCTACAAA 3240 

5 AGCCATTACG AAGGCAGACG TTGAGCGTTT AG CAGTTATG TTTGATGTCA ATCGCTCTAT 33 00 

TTTAAAAGTA GCAGAGCTAA CAGAAGAGTA TGTCGCTCAA TTAAAACGCC AACATGATGA 
AGATATTCGC ATTACAGAAG ATGCACAACG CGGTATGGAT AAATTATTCA ACCATGTTGC 

TGAGTCATTT GATAAAGCCA TCGACATGTT AGATGTTTAT GACAAAACGA AAAAAGATGA 34 80 

AATTGTAGAA CGTAGTAGAG AATCATTTAA TATTGAACAT AAACTACGCA AAGGTCATAT 354 0 

75 TAAACGCCTT AATCGTGGTG AATGTACAAC AAAAGGCGGA TTACTATATA TCGATATGAT 3600 

TGGTGTTCTT GAACGTATCG GTTATCATTC ACGAAATGTT TCTGAAGCAC TTGTTGGCCT 3660 

TAACGATGAT GTACCTACAG ATGAAGAAAT TGCAACAACT GAAATTTAAT TTTTACTGTC 3720 
TTATTTATAT TCATATTTTT TTAAAATTAG AGATTCArtAT rtPftTT.Tnaaa n^r^T^ 

* OWWWV^A^^n J/OVJ 

ACATTCATGG GTTGGCTTTT TTGTTTAGCA AAATTTATTA TCTTAAATCG GCTATAAACA 384 0 

CTGATATAAT AATG CTT CAT TAGTATGCGG TAAGCATGAC GGACACTGTT CTCGGAGTCT 3 900 

GACCCCGAAA CGTTTAATAT ACACTTTTAC ACGTCGCCTT CATTGAAGCG AATTGCCATA 3 960 

ACCTTCACAT TATATATAGT TCTTT C CAT A TAAATGTCCA AATTTTTAGA ACAACGCAAT 4020 

AAATAACCAT CCACCTAACT TATCAAAAAT TTAAGTGGAT GGTTTTTCAT TTTCATTTAT 4 080 

ATTTATATTA GTGTTAATCC AATCATAGAT TTATCTATAT GCACTG CTCT ATACATTTCC 414 0 

TCATTTAATT TGCTTTACTT TCATTTATAT CATTATCAAA ACACTTGGCG TGTCATCGTT 4200 

35 ATTATTTCGC ATCTTTGACA CGTTTATCAT CATTAGGAAT CGCGAATAAA ATTGCGATAA 4260 

ATGCCATGAT TCCCATTAAT ACGTTAACCC AAAGTGCAAT CATCGCACCT GTATGAATGC 4320 

TCGTTGCAGC AACTGCACCA GCATATACAG CACCACTAAT TGCGACACCG AATGCGCCAC 4380 

CAAGTGATGA AGCCATTTTA TAAATACCTG AAGCAACGCC AACTTTATCT AACGGTGCAT 444 0 

TCGAAATAGC TGTATCTGTA GAAGGTGTTG CAT AAATAC C TAAGCCTAGT CCGAAACATA 4 500 

AATATCCTAC GACACAACTG ATAACATAAA ATATGCCTGG TAAGAATACT AATGAAATAA 4560 

GTGCAATACC AATGACCACA ATGAATGTAC CTAATAACAT TGGTCGCTTA GAACCCATTT 4620 

TTTGTAATAA TTTTTCACCA ACTCGAATCA TCAATAACAC CATGATTAAA TAAGTAATTG 4 680 

ATAAGTATCC TGCCTGCAAT GCTGTATAAC CTAAACCTTG TTGCACGAAT GTATTCGCTA 474 0 

CAATTAATGT ACCTGCAAAA CCGTTTAATA AGAAGTTCGA AATCGTTGCA CCTGTATATG 4 800 

GTTTATTTTC AAATAATTTA AAATCAATAA GTGGATTATC TACTTTTTTC TCAACATTTA 4860 
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AACCAAGTGC TGCACCTTTA GTAATGACAA 
CAATTAGCCC TGCAACGTCA AATTTATGTG 
5 TCCCTTTGAT GAGTAACATT GAAAGTACGG 

TCCAACCCAT AGTTGTCGCA ACTGCACCAC 
AAGAACCGAT AGACCAATAA CTTAAGGCAC 

w 

TCATAATGGC CAATGTAGAA GGCATAATAC 
CTAAAATTAA TAATG CCGGT AAATTCGTAA 

/5 ATAATAAACC GATATTCGTC ATTTTCACGC 

CAACAACAAA CATGCCTGAA AATAGTG CAG 
TGTCTGTACC AAAACTTTGT TGTAAATTCG 

20 ACCAAAATGT AATAACACCT AATACAATAC 

TTTCATTCAT GTTAGTTATC TCCTTTAAGG 
GCAGAAATAA GTAATGATTT TTCTGAAATG 

25 TCACCATTTT CCACCGCTGC ACCTGTATAA 

TATGCAAAGT CTTCTGAAGG TGGTTGTGGT 
GCTTCTTTCA ACGTCTTAGC CACGTACTCA 

30 

TAATCATCGT TATATTCTAA GGTGCAAGTt 
AAACGTTTAA TTTCTTTTTC AATTGTTGCT 

35 CCTTCAATTT CAACAACATC TTTAATGACA 

ATTGTGACAA CACCGGTTTC AAATGGACTT 
GTGACGAAGT AGCTACCTGC AACAATGGCA 

40 CCACCTTTAC CTTGAACTTT CAATTTGAAG 

CTGTAATACA CTTTACCTGT TTTCATTGTG 
ACACCGTCTA ATACACCATT TTCAATCATT 

45 

GCTGGTTGAT GTATCACAAC GACTTTTCCT 
TCTGCTAATA CAAGCATGTA TGCTGTATGT 
TTATTTTGTG ATGCAAAAGA TAATCCTGTA 

50 

GCACGGATTG CTAATGTTTT ACCAGGTTTC 
GGTCCGACAT TCGTTTCTAC TTCCACATCT 

55 
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CGTTTAAACT TAGCAACATA ACTACTAGAA 4 980 

TATTGGTAAT TTCTGATTTC GTTTCAGGCG 504 0 

CAACGATAAT TGAGAAGATG AAAATCCATC 5100 

CGAAGAGTGA ACAGATACCA CTGCCACCCC 53.60 

GCTGACGTTC AGCACCCTGA TAATAAGTTT 5220 

ACGCTGCTGA TACACCTTGT ATAACACGAC 5280 

TAATAATTAA TGCTGAACCA ATAATACTTA 534 0 

GCCCAATTTT ATCTGCCAGA CCACCTGCTC 54 00 

TTAGACTGAC CGCAATACTA ATTGTCCCCA 5460 

GTACAACATT TACAAGTGAT TGTGCAAACA 5520 

CTAAGATTAA CTTGTTGCCC CCGCGATACG 5580 

TAATCTAAAA CAACTGTCCC TACTGCTTCT 564 0 

TTAAATTTAG GATGATGATG TGGGTAAATT 5700 

ATAAAGGCAC TTGGGCGTTC TTTAGCATAA 5760 

TCACACATTT CAACACCAAA ATCAAGGTTT 5820 

GTAAACTCTG GATCATTATA TAATGCTGGA 5880 

ACACCATACA TATCCTCTAA TCCTTTTGAT 594 0 

TTTGTAG CAT CTGTTAATCC ACGTACATCA 6000 

TTGAATTGAC CTTTACCGTC AAATGAACCG 6060 

AGTCGTCTAG ATACAACTGT TTGTAACGCT 6120 

TCATTGGCCA TATGTGGTGA TGAACCATGA 6180 

AATGCGCGTC CTGTTTGAAC ATAACCAGGT 624 0 

CTCATGACGT GTACACCTAA TACATGATCA 6300 

GTTTTAGCAC CACCTGGTGG TACTTCTTCA 6360 

GTAAAACTAT CTTTCATTTC AGCAAGCGTC 6420 

GCATCGTGAC CACATGCGTG CATAACACCT 64 80 

TCTTCAGTAA TGGGTAATGC GTCAAAGTCT 6540 

CCTGAATCAA TCGTTACTTT AATTCCACGT 66 00 

TTACCTTTGT AAAATTCAGC GATGTATTTC 6660 
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ATCATTTTGC 


CTTCTTTAGA 


TTTTAAAGTT 


TCAATTAATT 


GTTGATTCAT 


ATCCTTCATC 


6780 


TCCTTAGTTA 


CATCATAAAT 


GATTAATCAT 


TATTTATATT 


GCCAACAACA 


GAGATGTTAA 


6840 


CCATTAATTT 


TTTGCAATTT 


TAGCTTTGAA 


TATAAAAAAT 


CACAAATTAT 


GTATATCAAA 


6900 


ATTTGTGATT 


TGTGATCATT 


TTATGAACTT 


GGGTAACGTT 


TTACTTCAAT 


TAAGTGAATC 


6960 


CCATTCGTAA 


TCATTTTAAT 


GTTTAATGCC 


AGTGTGTCCG 


TGATATCTAT 


ATCATATACT 


7020 


TCTAATTTCG 


GAAAACTCAT 


TCGATTAACG 


TAATCTATAG 


AGTCCTTGTC 


CATGCCATGT 


708O 


ATCGTATGAT 


GTTTGCGCCA 


AAGATTAAAT 


AACGCACCAT 


TTTCTTTATC 


TAAGGTAAAA 


7140 


TGTTTAATCT 


TATACATACC 


TTCTTCCAGG 


GCATTAATGT 


TCAAATGAAT 


CATTTCCGTC 


7200 


GCACGCATAT 


TCATTTGATT 


GTCCAACGCT 


AAGTACGGAT 


TAAAATGCTT 


TGCATCATAT 


7260 


AACAATATTT 


GAAAATTTGA 


ATCAGTCCCC 


GTGACAATAC 


ATGTATCATC 


AGAATACAAA 


7320 


ATATTGCTTG 


TTAATTTATT 


A AATAGCAAT 


GCCGTGAAAT 


AGACCGGP*CG 


^ * * * wwii An 




TATTGATGAA 


ATAGTTCAAT 


AGAATTCATA 


TAATCCCGTT 


CATTTTTACA 


ATGACTGACG 


7440 


TGCAAATCAT 


AATTCAACCA 


ATACCCGATA 


CCCTCTACTT 


TAGAACTTAA 


TTTTAATAAT 


7500 


TGCTCAATGA 


TGATACCACC 


TCTAAAATAT 


TCGCCGTTTG 


TAATAAATGT 


ATCACCCGTC 


7560 


AATGTATTCC 


AATTGAGTAA 


AATGAGTGGA 


CGCTTTAGGC 


GATGACGATG 


CATTAAGTCG 


7620 


ATAAGGTAAT 


TCGTTTTATT 


AATAATCATT 


TGACTCGCGG 


TTTTAAATTC 


ATCATCATTC 


7680 


ATTTTATTAA 


AATCAACAGC 


GTCATTTGAA 


TTGGCATCAA 


ATACAAAATG 


GTCGATGTGT 


7740 


GGCTCAAGTC 


GTTTCAATAA 


TGGTAGATGT 


CTTTCCGTAG 


CTTGATCTAA 


GTGAATGTAC 


7800 


AAGCCACCAT 


TAGGGAATAA 


TGCTTTAAAA 


TAATCAATCA 


TTTCAATCAA 


AGACGTGTGC 


7860 


AATGTCGTCA 


CATACAAGTT 


GAACTTCAAA 


TCTTTTCTAT 


GACTGACATG 


CAGGGCAACG 


7920 


TGATCGATAA 


AAATTTTAAA 


TGCATCGATA 


TAATCACGTG 


AGTCATACTG 


ATCCAAATGC 


7980 


ATGGTCAAAC 


TAAAGTTATG 


ATCTAATAAA 


AAGTCTAAAC 


ACAAATCAAT 


ATCATAAAAT 


8040 


ATATTCGAAA 


TTTCTGCATC 


ATACGTGAAT 


GGCGCATTGA 


GCTTTTTCAT 


GATATATGGA 


8100 


ATCACATCAT 


ATGCTAATAC 


TTCATTGACT 


TGAAAATCAT 


GATGACATGT 


AAGCAACTGT 


8160 


GATTGATACT 


GTGTATTGAG 


CAAATTCCTC 


AAATAGCCCA 


CTTGAATAAT 


ATGATTAAAT 


8220 


TGATTTAGTT 


GGTGATTGGT 


TGGTTGAAAG 


GCAATCTCTT 


TATAGTTCAT 


CrriTCAATA 


8280 


TCTTCAATAA 


AATGATTCAT 


TTCTTCAATG 


TAGTCATTTA 


AAAGTAATAT 


CAATTCACGG 


8340 


TCGTGATAAT 


CATGTTCTGC 


CGATTGCTGG 


TTTTCAGTGA 


TTGCTGGACG 


ATCACCTCGA 


8400 


TATTGTTTAG 


GTGTTTGATG 


CGTAAAGTGT 


TTAAATGTTC 


TCGCAAAGCT 


CGCTGCACTT 


8460 
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TTCGCATGCT CAATTCGCGT CGTATTTAAG 
GTAAACTTTT TAGACAGATG GCTCTCTGAC 
5 CTTAAATCTT CATGAAAATG TAACTCGATA 

TTTAAGATAC TTTGGTTCGA ATGATATGTA 
AACTGAATCA CAAGTTGTTG CTCAGTCAAT 

w 

GAAACCAGTC TTGCCATTAT ATTTCTCAGT 
GTTAAGTGAA AATATAGACA ATGCACATCA 

15 AATTGGATAT AACATATGAT GCCATCTTGT 
TTAATGATGA AAATGTCGCC ACTGTTGCAT 
GCCTCnCCTT TAATAACAAA ACCAATCATT 

20 CTCTCAGTTT CTACTCGAAT TAAATAATCA 
TGAATACGTT TATTTTACAT TATTTTACAG 

TGTGTGGATG ATTATTT AT C CTCACTCGGT 

25 

TTTTCACCTT TTTTCTCCAC AAAAGTAAAT 

TTTAAGTCTC CCgAACCTTT CaACaATAAC 

CTTTTTCGTA ATTGTTTTAC ATTATAGTCA 

30 

CTCGGTACCT CTGGATTATA TGATATATCG 
CTG C CAT ATT GCGCGAAGAA CTTAAAATTC 

3S ATACCTTTAG TTGGAATGAT TTTATTGTCT 
CTCTTAGGTC TACCATCTTC ATCATGAAGT 
GTCTTAGTGT TTCTATTCAT ATATAGAACC 

40 GGTTGAACAA CCATTTCAGA ACCAATAATC 
TCATCACGAT AACCTTCTTT ATCGTATAAA 
AAT G TTTTTT CAAAGCTTTT CTTAACTTCC 

45 

AAACTAATGA CTAATATCAA AAAACTAATA 
ATTTCACAAT CCTATTCTTC TTATTATCTT 
CATGATTATT TATCCTCACT TGGTTTAAAA 

50 

TCTTTTTTCT CTACAAACGT AAATTCAATG 
TTCCCTGTAC CyTTCAACAA CArCTTCGGy 

55 



AAATGATGGA ATCCTACACC TAG CGATTCT 8580 

CACCCAACGT ATTCGCTTAA TTCTGAAAGG 864 0 

TAGTCGCATA CTTGATTCAC TTTATCATCA 8700 

CGCGGGACAT AATGAATCAT ATGCATAAGC 876 0 

TTAGACAACT CATTATGTCG GATATGTGTT 882 0 

TGATGTATAT TCTTTGTTGT GGTCGCATCT 8880 

TCAAACTTGT CTGCTAAATA TTTCATTTGG 894 0 

TGAAGTTGAA ATCGATACAA GTCGCGGTGG 9000 

TGCGTCATAT TATTTTCATC ATAAATGTGT 9060 

AAACTATTGA GCCTTTTGAA ATCTGACATA 9120 

CGTTGCATAC TATCCCTCAA TTCAGTAATA 9180 

CAACATATTT GAATTTCATA TTGAATCGTG 924 0 

TCAAGATGTA GACTATCAGT AAAAAAAGTA 93 00 

TCAATGTCTT TATATCCAAC TGrTGaACCT 93 6 0 

TTTGGTGCTT TATTCGTTGG TATTTTATAT 942 0 

TCATTAGTTA ATTGATATTT TGCTGAATAA 94 80 
CCGTCTTTGT ACTTCGACAA ATCTTTAAAG • 954 0 

TCGATTTCTT TTTTTATATT TTCGTCTTTG 9600 

ACCATTTTAA CGGGATATTC TTTATCTTTA 9660 

GTTTCACTCA CTATATACTT CCCGGTTGTA 9720 

ATACCTTTTG ATTTCATACG TTCCCCTTTA 9780 

CATGTACCTT TATCATTTTT ATCAAATTCG 984 0 

TCCTCTAGAT TTTTAATCGG ATACATACTC 9900 

GCTTCTTTAC CTATGCCACA ACCAGCAGTG 9960 

TACAATACCA ATTTGTTTAA TCGTTTCATA 10020 

TCCTGGATTG ATTTCATATT TTGATCGAGT 10080 

ATTAACCCAT CACTAAAGTA AATGTTCTCT 1014 0 

TCTTTATATC CAACTGATGA ACCTTTTAAA 10200 

GCTTTATTTG TTGGTATGTC ATATCTTTTA 10260 
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15 



20 



ACCTCTGGAT TATATGATAT ATCTCCATCT TTATAATTCA TTAAATCTTT 
TATTGCGCAA AAAACTTAAA GTTTTCGATT TCTTTTTTTA TGTtTTCTTC 
TCAGTAGAAA TGAATTTATT ATTAATCATT TTAACTGGAT ATTTTTTTTG 
GCTACTTCGT ATTTCTCCGT CTTTAtTTCA TTAGTATAGT AAAAtCCTTT 
GTATTTCTAT CTATCTTCAA AAGCATGCCT TTTATTTTTA GAGCTTCTCC 
ATTGCCATTT GAGAATTTAC AATCCATGTT CCCTTATCAT TTTTATCAAA 
CGATATC CTT CTTTATCGTA TAAATCCTCT AGATTTTTAA TCGGATACAT 
TTTTCAAAAC TTTTCTTT 

(2) INFORMATION FOR SEQ ID NO: 222: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 110 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



AAAATTGCTA 
TTTAACTTCC 
ATTATCCTGA 
TGCACTTCTT 
TTTATTTTGA 
TTGATCATCA 
ACTCAATGTT 



10380 
10440 
10500 
10560 
10620 
10680 
10740 
10758 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 222: 
nTaTCaACTT TGGaATTTAA AgTCAATAAC TTTTTTAAAA ACTTTTTGTG TTCACAACCC 
GCTTCTTTTT CAACGCGTTT ATTGCTTAAC ACAAGAACTT ATTTTACCAG CATTCCAAAA 
CAAATCAACA TAAAAACGTA CAAAATAAAA GTAATTTTGT ACGTTTAGCA TATATTATAC 
CTATTTATTT GTAGCAG CTA TAACTTTTTG TGCAATCGAG CTATAAATTT TACCTAGACG 
ATCATCTGAT TGATATATTG ACGGTGCAAA ATCTTTTGGA TTCCAAGATG GTTGCTCTAA 
AGGTAATTCC CCAAGTAATT GAGTATTAAG TTCATCAGCT AACTTAGTAC CGCCACCTTT 
GCCAAAGACA TATTCTTTAT TACCCGTCTC TTTACTTTCA AAATAACTCA TGTTTTCAAT 
TACGCCAAGA ATAGAATGAT CCGTATGTTT TGCCATCGCA CCTGCGCGAg CTGCAACAAA 
TGCTGCTGTA GGATGAGGTG TCGTTACAAT AATTTCCTTA CTTGAAGGTA ACATCGTATG 
AACATCTAAA GCTACATCTC CTGTTCCAGG TGGAAGATCG AGTATTAAAT ATTCAATGTC 
TCCCCATTTA ACTTCTGTAA AGAAATTCGT CAACATTTTA CCTAACATTG GCCCTCTCCA 
TATAACTGGC GCATTTTCTT CCACAAAAAA GGCCATTGAT ATAACTTTAA CGCCATGACG 
TTCAACTGGA ATTACTTCCT TCCCTTTAAT TCCAGGCTTT TCATCAATAC CCATCATATC 
TGGTACACTA AATCCATATA TATCGGCATC TACTAATCCG ACTTTTTTCC CTTCACGAGC 
TAAGGCAACG GCTAAATTTA CTGCAACAGT AGATTTACCG ACACCACCTT TACCGGAGGC 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
640 
900 



ss 
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ATTTTCTTCT TTTGGTTTAA ATTGATTTAC TTTTTCTTCC GGCAATGTTT CAAATCGTAT 1020 

ACCGACCGTT TTCGCACCGT TTTCTTTTAA TGCATTAACA ACAGCCATCT GTAAATCTAA 1080 

aTTGCGtGCA CCACCTAATT GTGCCATTG 1109 



(2) INFORMATION FOR SEQ ID NO: 223: 

(i) SEQUENCE CHARACTERISTICS: 
w (A) LENGTH: 3997 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

15 

(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 223: 

TCTTTATTTA AAAAAATGAT TGTCTAGTTT GTATCTCTCT GAAGATTTGG CAATAAATAA 60 

20 AAGCCGATAA CCGTATAATG ATT AT CGACT TAAAGTTTAT GTGGCATTTT TTACTTTTGT 120 

AATTTCAGGT GAGTTAGATG ATTATTATCA GATAGATTAT TGCTTATAAT CATATGATGT 180 

TTGAATGATA TCTTTGATTT CACTGATTAG TGCTTCTTTA GGATTAGCAG TTGTACATTG 24 0 

25 ATCTTCAAAT GCGAGCTCTG CCATT CTATC AATTGACTCA TTTAATTCTT CTTCAGACAC 300 

ACCTTGTGAT TTCAAATTCA TTTCAATTCC GACTGATTGA CCTAATTCGT AGACAGCTTT 360 

AgCTAATGAT TCTACGAGTG CTTCTGTCGT ATTACCTTTT AATCCTAAGA ATTTGGCAAT 420 

30 

ATCTG CAT AA TCTGTATCTG CTCTGAAGAA CT CAT ATTT A GGGAATAATG CATGTTTTTG 4 80 

CGGGTCTTTG GCATTATAAC GGATAATATG CGGTAGTAAT ATCGCATTCG CTCTACCATG 54 0 

CGGAATACCA TATTCGCCAC CAATTTTATG CGCAATTGAG TGTGCAATGC CTAAGAATGC 600 

35 

ATTTGCAAAT GCCATACCAG CCAAAGTTGA TGCGTTATGC ATTTTCTCTC TTGAAACTTT 660 

ATCACCCTTT TCAACAGATG ATTTTAAATA TTCGAACGTC AATTTAATCG CTTGTAGACT 720 

40 CAAACCTCTT GTGTAGTCTG AAGCCATTAC AGATACATAT GATTCCATTG CATGCGTTAG 7 80 

TACATCCATT CCTGTATCTG CTGTAACGCT TTTTGGCACA CTCATCACAA ATTGAGGGTC 84 0 

AATAATTGCA ACGTCAGGTG TTAAAGCAAA ATCAGCCAAC GGATATTTTA CATTTGTTTC 900 

45 ACTATCTGTG ATAACTGCAA ATGGTGTTAC TTCTGAACCT GTACCTGATG TCGTAGGGAT 960 

ACAAATGAAC GTCGCATTTT CAGGCATGCC TATTTTATAA GTACGTTTAC CGATGTCTAG 1020 

GAACTTTTGT TTAGCACCGA AGAATGATGT CTCAGGGTGT TCAAAGAACA TCCACATTGC 1080 

50 

TTTTGCAGCA TCCATCGCTG AACCACCACC AAGTG CAATG ATTGTATCCG GTTGGAAATC 1140 

AACCATCATT TCCAGACCTT TATATACTGT ATTAGTTGAT GGGTTCGGTT CGACTTCGCT 1200 

55 
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ATAACCGAAT TCTACCATAC CAGGGTCACA GACAATCATC ACTTTTTCAA TCTTGTCCAT " X 320 

TGTTGTTAGA CTCATGATTG CATTTTCTTC AAAATAAATT TGAGCAGGCA CCTTGAAAAT i 38o 

TTGAGTATTA TTACGTCGTT TAGCAATCGT TTTAATGTTT AATAAATCTG TCGCACTAAC l440 

ATTATGTGAA ATTGAGTTTC TACCGTAGaA CCACAACCTA ATGTTAAAGA CGG AATCAAT i 500 

TCGTTATACA TATCACCAAT ACCTCCAACC GCTGATGGTG TATTTACAAG TACACGACAA 1560 

GCTTTCATTC TTAGTCCAAA ATCTTTTTGT AATGTTT CAT CTTCTGTATG GATAACGGCT 1620 

GTGTGTCCTA ATCCACCAAA ATGTAGTGTG TCTTCACAAA TTTGAAATGC TTGTTTTGTA 1680 

15 GATTGGGCTT TTACTAAGGC TAATACTGGA GATAATTTTT CACGAGATAA CGGATAGTCT 1740 

GAACCTACAC CGCTAATTTC GG CTATGAT A AGTTTTGTAT TTTCGGGGAC AGGTATACCT 1800 

GCTAATTCAG CTATTTCAAC TGCAGATTTA CCGACAATAT CAGGCTTAAT ACCTGTTTTT 1860 

TGTTfATTra TAaTTYZfaTT TTrTRftrrrT TffTT* jiwhxt >• ■ ! ■ .nn » » » , ^ _ _ 

^ ^-w AJ-kJ-k A WVJ. \-X*XXXArtrtV /\/\rt.Vj x>\ x i 1920 

TGATGTG CTT TAAATTCATT AGTAACATCT TTATAAATTT CTTTATCAAT GACTACAACT 1980 

TGTTCAGAAG CACAAATCAT ACCATTATCA AATGTTTTTG AACCAATGAT ATCATTTACT 2040 

GCACGTTTAA TGTGTGCTGT TTTTTCAATG TAAGACGGCA CGTTACCTGG TCCCACACCT 2100 

AATGCCGGTT TGCCAGTTGA ATATGCAGAC TTAAC CATGC CCGAACCACC TGTTGCTAGA 2160 

ACTAATG CAA TACCTTTGTG ATTCATTAAT TGTTTTGTTG CTTCGATAGA AGGCACTTCA 2220 

ATCCACTGAA TAATATCTTT AGGTGCACCT GCCTTCATTG CCGCTTCTAA TACAACTTCT 2280 

GCTGCACGCT TCGACGATTC TTGTGCACTT GGATGGAATG CAAAAATGAT TGGATTTCCT 234 0 

55 GTCTTAATTG CAATCATCGC TTTAAAAATA GTTGTCGACG TAGGATTTGT TGTTGGCGTA 2400 

ACACCACAAA TAACACCAAT TGGTTCCGCT ACATACGTTA ATCCTTTTTC TTTATCTTCA 2460 

CCAATAATCC CTACTGTCTT ATTGTCTTTT ATTGAATTCC ATATATATTC AGAAGCGTAT 2520 

40 AAATTTTTAA TCGCTTTATC TTCGTATATA CCTCTTCCAG TTTCTTCATG TGCTAATTTT 2580 

GCTAGCACCA TATGTTGATC AACAGCTGCT AAG CTCaTTT GATGAACAAT ATGATCAATT 2640 

TCTTCTTGTG ACTTTTTAGA TAATGCTTCT AATGCTTTTT TCCCTTTGTC AGCTAGAGCA 2700 

TCAATCATAA TTGCCACTTC TTGTTCTTTC GATCCACGAT TTTCTTTTTC AGGTATAGTT 2760 

AACATATACA ACCACTCCTT TATACTTTGT GAATTATTTC ACAAACATTA TAGTACATGT 2 820 

CTCTCAGGAT ATAAAGAAAA TTCTATACAA AAAAGTTTAA TTTCGAATAT TATTTGAACA 2880 

AATATCAAAT TTTAAAATAA ATGTTTTCAT GAAATCATTG TTATTTCGGT GTTTTTAGAA 294 0 

TGATTTTATA ATCATAATTT TTTCAATGAC ATAATTTATT CATAATTATA TATTTAATTC 3 000 
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TCCTTGTCGA 


TACCTATCAA 


CAGATGTTAC 


AAATAAAAAC 


CaCCCGTGTG 


AACGGGTGGT 


3 120 


TTGTTCTGCG 


gCTATAAGCC 


TTCCTTACTG 


GCCaGCCCTA 


AAAGGGCACT 


GACAAGTCAG 


3180 


CCAACTGCAC 


TACTATTCCA 


GCAATCCTAA 


AGGTTTACTC 


TTTTTTCTTT 


CTTTTTTTAT 


3240 


TTTTCTCTCC 


AGTGAAAGGA 


TCTAAATATT 


CTTCCATTGA 


AATTTCATCT 


GCAACGATAT 


3300 


CCTCTTGTAA 


TTGATTACGA 


ATATAATTTT 


CAATCACTTT 


TTTATTTCTA 


CCTACTGTAT 


3360 


CCACATAAAA 


TCCTTTACAC 


CAAAACTTTC 


TATTTCCATA 


TCTATACTTT 


AAGTTAGCAT 


3420 


GTCTATCAAA 


TATCATTAAA 


TTACTTTTCC 


TTTTAAATAG 


CCAACAAATG 


ATGATACCCC 


3480 


AAGTTTGGGT 


GGTATACTTA 


CTAACATATG 


GATATGATCT 


TTACAT AC CT 


CTGCTTCAAT 


3540 


TATCTCTACA 


CCTTTTCTTT 


CATATAATTG 


ACGTAATATA 


ATCCCTATAT 


crrrrrrrAT 


3600 


TTTTCCATAT 


ATCGCTTGTC 


TTCTGTATTT 


AGGTGCAAAG 


ACAATATGTT 


ACTTACAATT 


3 660 


CCATTTCGTA 


TGTGCTAAAC 


TGTTTGTGTC 


AGATGACATT 


AAATAGCATC 


TCCTCGTGTT 


3720 


GATTATTTTG 


GTTGGCTGAC 


CAATATTTAC 


TCTAACATGT 


AGAGATGCAT 


TTTTTTGACA 


3 780 


ATGGTAGAAC 


W X X X J. X VJVJVJ 




VjAAAIIjAXAI 


1 i iuvjCAAAA 


TTTATTTCG C 


3840 


CGTCCCACCC 


CAACTTGCAT 


TGTCTGTAGA 


AATTGGGAAT 


CCAATTTCTC 


TTTGTTGGGG 


3900 


CCCCGCCCCA 


ACTCGCATTG 


CCTGTAGAAT 


TTCTTTTCGA 


AATTCTCTGT 


GTTGGGGCCC 


3960 


CTGACTaGAA 


TTGAAAAAAG 


CTTaTTaCAA 


GCGCATT 
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(2) INFORMATION FOR SEQ ID NO: 224: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 13 91 base pairs 
3S (B) TYPE: nucleic acid 

<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

40 (xi) SEQUENCE DESCRIPTION : SEQ ID NO: 224: 

GnGCGAGACA AACACACtTA TTGGTGCCAT TATmCcTAGA ATGaATTCaT ATGCAGTAGA 60 
TGAaaCAATC AAAGGATTGG CAAAACAATG CCAAAAATAT GAATCaCAAT TAATTTTAAA 120 

45 

TTACACAGGT TTAAATATCG AAGCAGAAAT ACAAGCGCTT GAAACATTAG CACGCaGTAA 180 
AGTAGATGGT ATTGTTTTAA TGGCTACAGA CATAACAGAG AGACATATTG AAGTCATTAA 24 0 

TAAAATGAAT GTACCAATCG TTATTGTTGG TCAACAACAT GAACAACTTC ATAGTATTGT 300 

SO 

GCATGATGAT TATAAAGCAG GTCAAATTAT AGGCGAATGG ATTGGTCAAC AGGGATATCA 360 
ACAAGTTGAA GTGTTTAGTG TAAGTGAAAA AGATATTGCA GTTGGTATAC ATAGAAAACG 420 

55 
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TACTTATGTG GAAGCACAAA AAGATGTTGC AAATGTTTTG GAAAATGTGG AGCAAGTAGA 54 0 

TGCGGTTGTT GGAGCAACTG ATACGATTGC ATTAGCTGCC TATAAATATT ATTCTGATAA 600 

AAAAGATGTT ATGAAACCAC AT CAAATAT A TGGTTTTGGT GGTGACCCAA TGACACAATT 660 

AGTGTCTCCA TCGATAAAAA CAATTCATTA TAATTATTTT GAAGCTGGCC AATGCGCGAT 720 

GGaAGAGATA CAACAGATGC TTAAAAAGCA AGATATGCCA TATAGCGTCA CAGTAGATGT 780 

TAATATTTAG ACGCTGTATT TTTTAAAATA AATGTGGAAC CGATACCATA TAACTATAAA 840 

TGGATAGGTT AAAAGTTAAA GAACGTAGGT AAAATTTGCT ATAATAGAAT ATAAATTGTT 900 

75 AACAGCATAA ATTATAAAAG GAGGACTGGG TAAATATTAT GACCGAATGG ACTAGAGAAG 960 

AACGTTATCA ACGAATCGAG GACGTTGATA CTGAGTATTT TAAAACATTA AAACAACAAG 1020 

TTGATCAATC AAAATTTCGT CAACAATTTC ATATACAACC AGAAACAGGC TTATTAAATG 1080 

— — -—>---•-*»»» r»« ±r\±\J ± llVJ\UtlUV\ 1 VjVa X A UCLA'i' 114 0 

TAGGCGCAGT ACATGGCTTA AAGTATTGGT ATAACTACAC GAGTGATGAC TTAATAAACT 1200 

TTAAAGCTGA AGGGCCAATT TTAAATCCAG ATACTAAATA TGACAGCCAT GGTGTATATA 1260 

GCGGTAGCGC TTTTGAATAT AACGGGCATT TATATTATAT GTACACA(5gA AATCATCGAG 1320 

ATAATCATTG GCAACGACAT GCGAGTACAG ATGATCGCAC GATTGAAAGA AGACGGTTnC 13 80 



20 



25 



30 



45 



50 



AGTTGGnAAA A 

(2) INFORMATION FOR SEQ ID NO: 225: 



1391 



(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 93 0 base pairs 
35 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY : linear 



40 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 225: 

ATTTATTTTA ATGTTTATAT TTTCTAACAC TTTTTTATGA TCATAGTAGT AATTGACATT 60 

TTTCAATTCA AAGACTGGTG TCATCGTATc TCACCTCGCA TTCAACTATA CAACTCCTAG 120 

TAACATATGT AAACAGTAAT GTTTACGACT CAAAATTAGA CAAAATAAAG AGATATGCC C 180 

CCTTCAAGTT TTATTTATCG CATTTCTTGA AGAGAGCATT ATCATTTTAT TGTTGCATAA 24 0 

CCTTATTTTT TAATTCTGGG TCAAATTGCT GTTGTTTTAA CATTTCAATT TCAAGTTTAT 300 

ATGGCGGTTT TTTATTTTTC TTATCTTCAC CAACATAAGG TGTTTCTAAG ATTTTCGGAA 360 

TATCTTTAAA ACTATCATGA TGCACAATGT AATTTAATGC ATCAAAACCA ATGTAACCGA 4 20 



55 
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GAACAACTTT GATTCTGTCG ACTCCAATGA TTTTATCAAA TTCATTTAAT ACGCCATCAA 
AGTCCTCTTT AACATTATAT CCAGCAT CAT GCGTATGACA TGTATCAAAA CATACTGATA 
AACGTTCGTT ATTATGAACT CCATCAATAA TAOGTGCTAA CTCTTCAAAT GAGCGACCAA 
TCTCTGTACC TTTACCTGCC ATCGTTTCAA GCGCAATACG TACATTATTG TCATTCGTTA 
AAACTTCATT TAATCCTTCA ATAATCTTAT TAATTCCGGC ATCAACACCA GCTCCAACAT 
GCGCACCTGG ATGTAATACa ATATCTTTAG CCCCTATAGC TTGCGTTCTk TCaATTTCTT 
GTTGCAAGAA ATCTACACCA AGATTAAACG TTTCTGGTTT GGTTGTAttG CAATaTTaAT 
GATGTATGGT GGCATGAACA ACAATATTAG 
(2) INFORMATION FOR SEQ ID NO: 226: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1984 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 226: 
TGACGCACCA ATTTATAACG CAATTGACAA AACAATTAGA TATACCTGTG AAATTTGTAC 
CTGGAAACCA TGATTTATGG GAAGTTGAAA GTATGACTAC GCAAGACATT TGGAATAATT 
ATAAGAGTAT GTCACAGTGC TTGGTAGGAA AACCATTTAT AGTAAATGAA GAATGGGCAA 
TCATAGGACA TACTGGCTGG TATGATTATA GCTTTGCAGC ACAACGATTT TCATTAGATG 
AGTTACAAAA AGGAAAACAT TATGGTG CG A CTTGGCAAGA TAAAGAACGA ATATCTTGGG 
GCATATCAGA TCAAAATTTA TCTAAAATAG CGGCTGAACA AGTGAAGAAA GATATATTAG 
AAGTAGGAAA TAGACGAGTG ATTTTAGTCA CACATGTTGT GACGCACCCT GATTTCATTG 
TTC CTATGCC GCATCGTATA TTCGATTTTT ATAATGCATT TATTGGGACA AGTGATTTCA 
ATCCTTTGTA TGCGATGTTC GAT AT AC CAT ATAGTATTAT GGGCCATGTT CATTTTCGTA 
AAAGTGTGAT AGATGATGGC AGATGTTATC TCTGTCCGTG TCTAGGCTAT CCAAGACAAT 
GGCGTTCAGA AGATATTTAC CAGGAAATAA ATGAGACGAT ACAAATAATA GAAATTTAAA 
ATGCGCAAAC CTGACCCAGT TTGCGCATTT TATGTTTTAC ACACGCGAGT AATGTGTTTA 
CTTACGTGTG TTTATTTTGT TGCTGATTTT CAATTGTATA TGAATGTGGT TGCACATAAA 
TGCACTTTCT TCCTGGTGAA TTAAAGCTGT ATTCCATTTT CTCTTTACGA ATTTTAATAA 
TTTGTTTGCG ATTTGGAATO ATGGCAGGTA AAACTAGGCC ACGACGAATA TGACTCCAAA 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6373 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
40 (D) TOPOLOGY; linear 
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TTGAAACTTG TTTCGCTGGC TTGTTATCAA AGCGGAAAAC AC GTAGTAAT GGTTTAGAAC 
CAAGATTAGT ATGGTATATT AACACAGGTT GACCTTGATC GATAATACCT TTAAGATCTT 
CTAACGATTT ACCAGTGCCG TCTACGATAT TAGGATTGTA TTTTTGTAAA AATGGTACAT 

ATGCTTCTGG AAATATCGTT TGATGATAAT TGCCAAGCTT AATGAATAAG TGATGTCCAA 1200 

CATAACCTTT ATGTGGATTG TTCGGATGTG TCGGCCAATG TCTCATAATT TCTGTAGCAG 126 0 

GGATATGTTG GTTGTTGTAT TGCAACATCA TGGCTGCGGA AACACCTTCA CACCCCATGA 1320 

CCATAGGGAT AGGAAATAGC TGACTGATAG GTTTAACTGG TAATATTTTT CGGTTCATAA 13 80 

TATAGTCCTC GCATTGATTC AATAAATATT TAATATAATT ATAT AG CGTC AATGCAAAAT 144 0 

GTCCTAAACA TATGTTTTAC ATGAGTGAAT AAAATTAATG GAGTGATAAA ATGGAATATC 1500 

AATTACAACA ACTTGCGTCG TTAACGTTAG TAGGTATTAA AGAAACGTAT GAAAATGGAC 1560 

w * w w« w» xT*±r* wv-nvjvjvj ± x x x wjLAftauAi\i n ATLAAQAG GGAGTAATTG 1620 

CGGATTTACA GTTAAAAAAT AATGGTGATT TAGCCGGGAT ACTTGGCTTA TGTATACCTG 1680 

AATTAGACGG TAAGATGTCA TATATGATTG CAGTTACCGG AGATAATAGT GCTGATATTG 174 0 

AAAAATATGA TGTCATAACA TTAG CAAGTT CAAAGTATAT GGTATTTGAA GCACAGGGCG 1800 

CAGTACCTAA AGCAGTTCAA CAAAAAATGG AAGAGGTTCA TCACTACATA CATCAATATC 1860 

AAGCAGATAC GGTAAAATCA GCACCATTTT TTGAGTTGTA TCAGGATGGT GATACTACAA 1920 

GTGGAAAATT AATATTACCA GAAATTTGGG ATnCCTGTTA AAGGGGTGAT TGAAATAnGA 1980 
AnTG 

(2) INFORMATION FOR SEQ ID NO: 227: 



1984 



45 



SO 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO; 227: 

GATTCCACGT GTGTTAAAAG AAGTTACAcC TTCAATGATG GTATTTACTA ATTTCTTTAG 60 

AGATCAAATG GATCGCTTCG GTGAAATTGA TATTATGGTT AATAACATTG CAGAGACAAT 120 

TAGTAATAAA GGCATCAAAT TATTGCTAAA TGCTGATGAT CCATTTOTGA GTCGTTTGAA 180 

AATCGCAAGT GATACGATTG TGTACTATGG TATGAAAGCA CATGCCCATG AATTTGAACA 24 0 

AAGTACGATG AATGAAAGTA GATATTGTCC AAACTGTGGT CGCTTATTGC AATACGATTA 300 
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AAAATATGAA ATATCAAGTT TTGATGTGGC ACCGTTTTTA TATTTAAATA TCAATGATGA 4 20 

AAAATATGAT ATGAAAATTG CAGGTGACTT TAACGCTTAT AACGCGTTAC AGCATATACT 4 80 

GTTTTAAGAG AG CTAGGGTT AAATGAACAA ACAATTAAAA ATGGCTTTGA AACGTATACA 54 0 

TCAGACAATG GTCGTATGCA GTACTTTAAA AAAGAACGAA AAGAAGCGAT GATCAATTTA €00 

GCTAAAAATC CTGCAGGAAT GAATGCAAGT TT AT CAGTTG GTGAACAATT AGAAGGCGAA 66 0 

AAAGTGTATG TTATTTCGCT AAATGATAAC GCTGCAGATG GTCGAGATAC TTCATGGATT 720 

TATGATGCAG ATTTTGAAAA ATTATCTAAG CAACAAATTG AAGCTATCAT CGTGACAGGT 780 

, 5 ACACGAGCAG AAGAACTTCA ATTGCGATTG AAGTTAGCAG AGGTTGAAGT AC CAATTATA 84 0 

GTTGAGCGTG ATATTTATAA AGCAACGGCA AAGACTATGG ATTATAAAGG TTTCACAGTT 900 

GCAATACCAA ACTATACATC ATTAGCGCCT ATGCTTGAAC AATTAAACCG TTCGTTTGAA 960 

20 GGAGGTOAAT CATAATATGC ATGAATTGAC TATTTATCAT TTTATGTCAG ATAAATTGAA 1020 

TTTATACAGT GATATAGGAA ATATTATTGC TTTAAGACAA CGTGCTAAAA AACGAAATAT 1080 

TAAAGTTAAT GTCGTAGAAA TCAATGAAAC AGAAGGTATT ACCTTTGATG AATGTGATAT 1140 

TTTCTTTATC GGTGGTGGAA GTGATAGAGA ACAAGCATTA GCAACAAAAG AATTAAGTAA 1200 

AATTAAGACA CCACTTAAAG AAGCGATTGA AGATGGTATG CCGGGATTAA CGATTTGTGG 1260 

AGGCTATCAA TTTTTAGGGA AAAAAT ATAT CACGCCTGAT GGTACAGAAT TAGAAGGGTT 1320 

AGGTATTTTA GATTTTTATA CTGAATCAAA GACAAACCGA TTAACAGGAG ATATTGTTAT 1380 

CGAAAGTGAT ACTTTTGGAA CTATTGTAGG TTTTGAAAAT CACGGTGGTA GAACATATCA 144 0 

35 TGATTTCGGT ACACTTGGTC ATGTTACTTT TGGTTATGGT AATAATGATG AAGATAAAAA 1500 

AGAAGGCATT CATTATAAAA ATTTATTAGG TACTTATTTA CATGGACCAA TTTTACCTAA 1560 

AAAfTACGAA ATCACTGATT ATCTGTTAGA AAAAGCTTGT GAACGTAAGG GTATTCCGTT 1620 

40 TGAGCCTAAA GAAATAGATA ATGAAGCGGA AATACAAGCG AAACAAGTAT TAATAGACAG 1680 

AGCAAATAGA CAGAAGAAAT CTCGTTAACT CTGAACATCG CATCAATGGA TTTAATATTG 174 0 

ATAAACGATG AAGTTTAGTA ATTAATCATA TATGTATAAA CACACACATT ATTTTGGATG 1800 

GAAACAACCA AATTGATGTG TGTTTTtTTG TTCTAGTGAA TAATTATTAT ACAATGAGTA 1860 

TCTATCCTAG AATTATCAAT AGTAATGGTG ATTATGCAAC ATGAAAAAAT GAATGATGAA 1920 

AGGAATTTGA CGATGAAGCC TACTAAAGTG ATATTAAAAG ATGCATCTTA TTTACATAGC 1980 

AAAACATCGA TAACATTTAT TTTAAAAGAT GTAGTTATCG AAGAAGATAA TAAAATTTAT 2040 

TATTTCGACA CTAGTGCAcT TTCGAAGATC AAGAAGTTAA ATTTGAATTT GCACTCTTTG 2100 
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TTATAGAACC TGATTTACAT TTTACAATTA TTGATTTTAA TCAAGAACTG CTTTGTATTT 
ATATTGATTT TGATTCTGGT TTAAGGCATT CAAACATGGC AACAGAATCT GGTATTTCAT 
TAAGGATAAA TGTTGCTAAA TCAGATTTTA CTAAATTTAT TAATGAATTA GCCTCTTTAC 
ATTAATGATT TAAATCTGAT ATGTAATTAC AATCAAAAAA GACAGCCACA TCCCTCCGTA 
GTTTAGGCGT GTGGCTATAT TTGAGTCTGA ATATTTATGC TTGTAATTTT AAAAAGGGAC 

ATGCTATATA CGATAAAAAG AGGCGGGGAC ATAAATCAAT GTTCTATGCT CTACGAAGTT 2520 

ATATTGGCAG TAGTTGACTG AACGAAAATG CGCTTGTAAC AAGCTTTTTT CAATTCTAGT 2580 

CAGGGGCCCC AACAAAGAGA AATTGGATTC CCAATTTCTA CAGACAATGC AAGTTGGGGT 2640 

GTGGGCCCCA ACACAGAGAA TTTCGAAAAG AAATTCTACA GGCAAAGCGA GTTGGGGTGG 2700 
GACGACGAAA TAAATTTTAT GAAAATATCA TTTCTGTCCC ACTCCCATGG TG CCAATTAG 
CATAAGGTAC TTAAATTAAG CATATCTGCT GTCTAGCAGT CGATA AATCA TTAGAACTTC 
GTATAGTATA TGACTTTTAA TTTGATTTTC ACCACTAATT TCAAGTGCTT TTATAGTCGA 

ACGTAAAGTT TCTACAGAAT CATCTTCTCT CTTAAAAGAA C CAT CAT AAA ATATATCTTT 294 0 

GATGCTACTA CTAATTTTTA GCAATG C CAT TTTTTCGTCA CCTGAAAAGT TAACACGAGT 3 000 

ATTTTTAGGC AAGTAAATGA TATTTGATAA ATGAGTGATA AACAAACGAT TCGTATATGC 3060 

ACGTTTAGTT AATTGATTGA GTAATTTCCA ATCACATTCT TTTTTCTTAT GATAGCTTAA 312 0 

TTCATCACGT TGATAACTTA TTAACGTTTC AACTTGATTA TTTAAATTGA AAATATTTTT 3X8 0 

AT ATG CTTTT TCGCTTTTAT CAGATTGCAG TCTTGATAAG ATAAGTTCTT GGCAGCGATT 324 0 

GTAAAATAAT TTATACATCA AGGCATCTGT CTTACTTAAT TTTTCTTCGA CCTGACCATA 33 00 

ATACTTAGGT GGAAACACCA TGAAGTTAAT TAAACCTGAT GTCACGAGTC CAATAATTGC 3360 

TGTCAATGTT CGAGACAAAA AGTTGAATAT GTAGGCATCA TGAATACCTG GAATCATAGC 3420 

TAATGATGTT AGTACAGCGA CATTCGTACC AACTTGCAAT TTGAGTTTTG TACAGAATAA 34 80 

AATCGTGAAC GTTGCACTCA ATGCATATGT AAAAGGTGAT TGATCGCCGA ATAAATATGT 3 54 0 

AAATAATACT GCAAAGCCTG CACCAATTAC CGTAGCAGGT AATCTACGAT AACCTTTAAT 3600 

AAGTGATGCC TTGGCAGTTG GTTCAATTGT GACTACAG CT GTTAAAATGG CATAGATGGG 3 660 

TGTTAAATCT AGTGCCATAC AAAAGACAGC TGTTAAAAAA ATGGCAATAC CAGTTTTAAT 3 720 

TGTTCTGGCA CCAATTAAAT GTTTATACCA TTGATCGTTC ATTTTTTAAC CTCTAATCAT 3 7 80 

CGTAAAATCT TAGCGAGCGC TTTATAATAA TAGTATCGTA CATTGGAAAA GTTCATGTAT 3 840 

GTAAAATATT TGAAATAATC ATACATAAGC ATTACTTTGA TTTTCATATA CATTAATCAA 3 900 
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CAAGCATTTT TCAATTATAG TCCGGGGCCC 
ACAGGCAATG CAGGTTGGCG GGGCCCCAAC 
5 AATGTGCAGG TTGGCGGGGC CCCAACATAG 

TGCAAGTTGG GGTACAACGA TAAAGAAATA 
CTTTCCAAAA TACTAAAGTA ACATCTTTAG 

70 

ATAATTATAT AAAAAAGGAA CGGGATAAAA 
CGTTAAAAGA AATTGGATAC AT ATGCG CTA 

15 AACCAGGTAT CACTACGAAA GAGCTTGATA 

GTGCTATTTC TGCGCCAATT CATGATGAAA 
ATGAAGAGGT GGCACATGGG ATTCCAAGTA 

20 ATATTGATGT ATCGGCTTTG AAGAATGGCT 

TTGGAGAATC AGATGATCCA ATGAAACAAA 
AGAATG CAAT TGCAAAAGTA AAACCGGGTA 

25 ATAATACAGC TAGACAAAAT GATTTGAAAG 

GTTTATCATT ACATGAAGCA CCAGCACATG 
CATTATTAAC TGAAGGTATG GT ATT AG CTA 

30 

TTGTTACAGA AGGTAAAAAT GAATGGGCTT 
AAATTGAGCA TACGGTTATC GTGACTAAGG 
AAGAATAGTT CAACATATAC TAAGACTAAA 

35 

TCATATTGGT TTCGGAACTG TTTTATAATA 
AAATATGTTG TAACAAAGTA GTTTTTAAGC 

40 TAGCGCATTT GGTATTTTAA AACTTATTAT 
GTTATATTGA ACAGTTTTTG AGAGCAACAG 
TGCTAGATGA AAAAATGAAA AATTTAGATG 

45 AACAACTTAG CAAGTTAATT GACAGTCTAA 
TTGCTGAAGC ATTTCAAATT CAATGTGCAA 
TTAAATCAGA GTTGAATAAA GTTGAAGCAT 

50 

AAACTTCAAC TGAAAAAATA GCAACAGAAA 
CTGTGGCATA GAAAGGCGGC GAAACATGAC 

55 



CAACATAGAG AATTTCAAAA AAGAAATTCT 4020 

ACAGAAGCTG ACGAAAAGTC AGCTTACgAT 4 080 

AGAAATTGGA TCTACAATTT CTACAGGCAA 414 0 

TTTTTTCTTT ATCACACTAT GTCTCACTCA 4200 

TATATCAAAG AATTTTTGCT ATAATAAGTT 4260 

TGATTGTAAA AACAGAAGAA GAATTACAAG 4 3 20 

AAGTGCG CAA TACAATGCAA GCTGCAACCA 43 80 

ATATTGCGAA AGAGTTATTT GAAGAATACG 4440 

ATTTTCCTGG TCAAACGTGT ATTAGTGTCA 4 500 

AGCGTGTCAT TCGTGAAGGA GATTTAGTAA 4 560 

ATTATGCAGA TACAGGCATT TCATTTGTCG 4620 

AAGTATGTGA CGTAG CAACG ATGGCATTTG 4 680 

CTAAGTTAAG TAACATTGGT AAAGCGGTGC 474 0 

TCATTAAAAA CTTAACAGGT CATGGTGTTG 4 800 

TACTTAATTA CTTTGATCCA AAAGACAAAA 4860 

TTGAACCGTT TATCTCATCA AATGCATCAT 492 0 

TTGAAACGAG CGATAAAAGT TTTGTTGCTC 4 98 0 

ATGGTCCGAT TTTAACGACA AAGATTGAAG 5040 

GTATGAACAT CATTTAGTTC CGGAGCCTAT 5100 

ATTAAGAACA CAATCAATGC GTCATTTCAA 5160 

AAACATATCA TCGACATCAA CGAAGATACA 5220 

AAAAGGTGAT AGTTATGAAC TATGTTGAAC 5280 

TAAGAAATAA TATCAAGCAC TACCTTTTAA 5340 

ATT AT ATG CG TTATTTAATT ACTAAAAAAG 54 00 

TGCTAACATT AGAAAATAAA TATATTGATA 54 60 

GAGAAATCAA TAATCAAGAA ATTGAAAATA 5520 

ATTATGCAGA AATTGAAACT CAAATTCAAC 5580 

AAACATCGTA TCTAATAAAT TATATGAACG 5 64 0 

ACACAAATAT ATATCAACGC AAATGTTGAT 5700 
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CTTTTTACTC GTTCTATTAT TGGGATGTGT ATTAGTTTAT GTAGGATATC TTTATTTTCA 5820 

TAAAATACGT GGCCTTTTGG CGTTTTGGAT AGGCGCGCTA TTAATTGCAT TCACATTATT 5880 

GTCTAATAAG TATACAATCA TCATCTTGTT CGTCTTTTTA TTATTACTTA TTGTGCGTTA 5940 

TTTAATACAC AAGTTTAAAC CAAAAAAAGT AGTTGCGACG GATGAGGTTA TGACTTCACC 6000 

ATCTTTTATT AAACAAAAGT GGTTTGGTGA GCAACGTACA C CAGTTTATG T AT AT AAG TG 6060 

GGAAGATGTA CAAATTCAAC ATGGAATTGG CGACCTACAT ATTGACTTAA CAAAAGCTGC 6120 

AAATATTAAG GAAAATAATA CCATTGTTGT TAGACACATT TTAGGTAAAG TGCAGGTTAT 618 0 

ATTGCCGGTT AATTACAATA TTAATTTACA TGTAGCTGCT TTTTATGGAA GTACTTACGT 624 0 

GAATGAAAAA TCATATAAAG TTGAAAATAA CAATATTCAT ATTGAAGAAA TGATGAAACC 6300 

GGATAACTAT ACAGTTAATA TCTACGTATC AACGTTTATC GGAGACGTAG AGGTGATTyA 6360 

20 TCGATGAAyC ACT 6373 

(2) INFORMATION FOR SEQ ID NO: 228: 



15 



25 



30 



40 



45 



SO 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 44 88 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 228: 
ATAGnGAAAG CGTTTTACAC TTAATAACTC CCTCTTAAAT GCATCCAGGT TCTATGTAGT ^ 60 

3S AAATCATGAA nATAACATAT AAATnTAGAG GAGATTTACC TTTGAATACA GAGAACAACA 120 

AGAATCAAAA CCAATCTGTT AAAAATTCTG AAAGaCGCGG CATGTTAAAA GGATGCGGCG 180 

GTTGCCTTAT TTCTTTTATT TTATTAATAA TCTTATTATC AGCCTGTTCA ATGATGTTTA 24 0 

GTAATAATGA CAATTCCACT AATAATCAAT CATCAAAAAC GCAATTAACT CAAAAAGATG 300 

AAAATAAAAA TGAAGATAAG CCTGAGGAAA AATCAGAAAC AGCAACAGAT GAGGATTTAC 360 

AATCAAC CGA AGAAGT AC CT GCAAATGAAA ATACTGAAAA TAATCAACAT GAAATTGATG 420 

AAATAACAAC AAAAGATCAA TCAGACGATG ATATTAACAC ACCAAACGTT GCAGAAGATA 4 80 

AATCACAAGA CGACTTGAAA GATGATTTAA AAGAAAAGCA ACAATCAAGT AACCATCATC 54 0 

AATCCACGCA ACCTAAGACC TCACCATCAA CTGAAACAAA CACGCAACAA TCATTTGCTA 600 

ATTGTAAGCA ACTTAGACAA GTATATCCGA ATGGTGTCAC TGCCGATCAT CCAGCATATC 660 

GACCACATTT AGATAGAGAT AAAGATAAAC GTGCATGTGA ACCTGATAAA TATTAAACAA 720 
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GGGAGATTTT TTAGGCATGA GCAATCAATT 
ACAATTCCAA GCTTTCCAAA ATCAACAAAA 
5 ATCTAAAAAA GGATGGTTCT GGGGCTGTGG 

CATCGGTATT TCAGCTTGTA CAGCTGGTAT 
AGAAACGAAC AAAACCCATA AAATCGGTGa 

W 

TGTAAATTCA GTGGAAACTA TGAAATCTGT 
AGGTATATTT GTCGTTG CTG ATGTGACGAT 

15 TGATAGTTCA ATGTTTAAGC TAAAATCCGG 

TTCAATGTCT GCTAATCAAA GTGACAATGG 
TATAAATCCA GATAG CACTG CTCAAGGTAA 

20 AACGCAAAaG ATAAAAAATT AGAAGTTATT 

TTTGATTTAT CCGATG CTAA AAAAACATCA 
GTAGCTGTTG CGAGTTCAAA TAGCGATAAT 

25 GcTACAACTT CTAGTGCGGA TACTGATTCT 

GATAAGCAGA ATGCGTCTAA AAgTGATAAA 
GAAACTG CTC CTGTAGAGCC CATGCCCCAT 

30 

AGCCAAAATA TTCACAaTGa AGATAGCmTG 
tAGCTCGGCT ACCCTTCTTT TACGGAAAAA 
AAAAAATGAA ATTCAAAGCT ATCGTTGCAA 

35 

GTGGTGCTAA TCAACATAAA GAAAATAGTA 
AACAAACTGA CAACACTACA CAGTCAAATA 

40 AAGATATAGT TCGAAACGAT TACAAAGCAA 

ATAAAACAAA TCTTGAACGA AGCAATGAAC 
ATGCAGTTGG CACACCATTA AAACGTTGTG 

45 TTAATATTTT TGATGATATG TCAGAAAAAG 

GAAGCCCTAA ATACAATCCA GGTATGAACA 
ACATTCAACA TCATGACATT GATAATAACA 

SO 

AAGTCGACGA TAAAAATGAT AAAAATGCTG 
CAAATAATTC TGAAGAAACT AAAGTTAAAT 
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CAAAAGCGAA GAAGAGCGAA GACAATGGGA 340 

CCAACAGAAC CAGCAATACG GACAAAAGAA 900 

TGGTTGTCTA GTATTATTTA TTTTAATTAT 960 

TACAGGTAAC CTTGGCGGAA ATAGTT CTAA 1020 

AACTGTTAAA AATGGCGACC TTGAAGTCAC 1080 

AGGACCATCT CTTGCACCAA CAAACGCTAA 114 0 

TAAAAACAAA GGTAAAGAAG CGTTAACAAT 1200 

TGATAAAACA TTTGAAGCAG ATAATACAGG 1260 

TAGTATAGAA AATTCATTTT TCTTACAGCG 1320 

AATTGTTTcG ATGTGTCAGA AAACATAGCC 1380 

TCTAGTTTAT TTAGCGTCAA GAAGATTACA 144 0 

AAAGCTAAAA AAGACAAGCA AGATACAGAA 1500 

GTAAGTTATG AAGCTTCGGC TACTACACCT 1560 

GAAGATAGCG AAAAGTCTAG TAAAGATGAG 1620 

TCTAGTGTAG AAAAAAGTGA ATCTAATGAG 16 80 

AGCAAACCTA CCACTAGTGA aGCACCACCT 174 0 

TACGACGCTT CAACAGAATA AAATtnyCAG 1800 

TTAATTATAC ATAATCaAAT CaAGGAGATA 1860 

TCACATTATC aTTGTCACTA TTAACTGCCT 1920- 

GTAAATCAAA TGACACTAAT AAAAAGACGC 1980 

CAGAAAAGCA AATGACACCA CAAGAAGCCG 2040 

GAGGCGTTAA TG AAT AT CAA ACATTAAATT 2100 

ATGAATATTA TGTTGAACAT CTAGTCCGCG 2160 

CTATTGTTAA TCGACACAAT GGCACAATTA 2220 

ACAAAGAAGA ATTTGAAGCA TTTAAAAAGA 2280 

ATCATGATGA AACAGATGGT GAGTCAGAAG 2340 

AAGCAATTCA AAATGACATA CCAGATCAAA 2400 

TTAATAAAGA AGAAAAACAT GATAATGGGG 2460 

AATGGCATAC TTTGATTAAT CGTAATTTTT 2520 
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ACTATGCATG GTCTTTTTAA TCAACTTAAA CTCGGCATTA TTTCAATCGA AAACGCAGAG 2640 

CATACGCTTT TTACACCTTA TATGTTGGAA ACGCTCTCTT CCCTAGGCGT GAAAGACAGC 2700 

ATTGTCGATT TAATTCATAA AGGGACTGAA TTAGAAGACT TTGCGGCATT TAATTTATCA 2760 

ATTGAAGACA CAGTTACAGT CTGTTTACAA AGAACTGAAG AACTATTAAA ACAATACAAA 2820 

AATGTGGAAT TCAATGACAA AATATTAATC AATTGGCGTA TTATACAAGA GAAATAGACA 2 880 

TATAAAAGTC GAATGTAACt ACGTGAGTAT TGATTTTATT CTTTGTAAAT TACAAGCATT 2 94 0 

TCATATTATA AAGTTTGAAA AGAGGTATAT TGAAATGGAG AAAAATGAAT AT AT AG CT AA 30 00 

ATATAATGAA TATAGTCAAT TATTAGACGC TACATACTCG CAAGCTGTAG CATmCCTTTT 3060 

AAGtAAATaT GGCGCTGTAA CCGATGATTA TTATAAAGaA AAATCATACA CGCGATTTTT 3120 

AAAtGGAGnA ATCAAAAGTA TTTCAAAAGG AAAATACACT AG AG CT AG CG AaGGATTATA 3180 

20 TTG CCATCAT ATAAGCGAGG ACAAATTCCA AAATCTATCT GATCTAAGAT TCATtTCCAA 324 0 

ATTTAAGTAC TCATACGACG TTCAAAAGAA AGAAAACTTA GTGTACTGTG ATCTAATCGA 33 00 

GCATTTAATT TTACATGCAA TTATTACAAA AGAATCCCAT GGCCAATTTG GTGT AG CTGG 33 60 

ATTATGT CAA ATGATCAAAC CAACAGTCAT TGATTGGTAC ATTGGCGAAT ATAATCCAAA 3420 

ACCAGCATGG ATGCAAGCCA CCAAAGCACG TGCCTATTTG CCTGGAATAT TAGTAGAGAA 3480 

ATTACTCATT AAAATTGACG ATATGTTAAA AGGAATAGAA ATATAAGATT TCCTTGAGTC 3540 

TAGATAAATG ATTAATGTAG ATTTATTTTT TGCTGTTGAG ATTTTGTTAT AGATGTTTAA 3600 

ACCTGTAATT AAATATATTT TATAAAATAG ACCACGCATA CCTATCTATA AACGGrCAAT 3660 

GTTTATAAAT G AGTTTG CAT GG tCTTGAAT TGTATTAAAT TTCTTTTGGT TTTAATAAAT 3720 

CGACTAGATT TTCACAATAT TTATCAAATA TGTATTCCTA AATTATACAG CCTTAATCCA 3780 

GCACCTACTT TCGAAACTTC CAACTTAGTT GATATAAGGT TCAATAGTTT GTTTCGTTCT 3 840 

40 TTTTCAGATA AACCAGAACT TAAATTGATA TTATTGACTT CATAAAAATT ATAGACTAAT 3 900 

GCCTCTATTT GCTTTTTAGG CATAAGTAAG TCGACTGAAA ACTGATTTAC GTCGCTTTCA 3 960 

TAAATCATTT CATGTAAATT CTTTAGACTA TTATCGTTAC TATCTCTCAT TAAGTCTGTA 4020 

TTTTTAAATA AATAACGGCC CAATTCACGA GCTATTGAAA ATCTTGTATT ATTAATCGAG 4080 

TGATTATTAT TAATATAGAT TGTTCTTCCA CTTAAATAAC CCGAAGTATT ACCCTCCATT 4140 

TTAATATATC TAACATTTAA ATTAAGTTGA AATAATAGCT TGTCTATGTC AATAGCAAAG 4200 

TGTTCAGAAG TAATAAAAAG TTGATCCATT TTGTCCTTTA TAAATGCCTG AAATAATCGA 4260 

ACTATTTTTG ATTCTAAAAT ATCTTCATAA TGAACTTTCT CAATAACTTT CAATTGATTC 4 320 
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AACATTATTA AAATAAAACC CCTCTACTAC TATATGTAAC GAAGGGACAT GATTTCAAAA 
TAAAATACCT TTTTTATAAA TnTATTATAA TATCCCCCAC TATACnAC 
5 (2) INFORMATION FOR SEQ ID NO: 229; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 846 base pairs 
<B) TYPE: nucleic acid 
io (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



is 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2072 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 230; 



4440 
4488 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 229: 

TATGGCGCCA TATTAGTTGT AACTGGTTTA AGAGGTCcAa GAAaTATCaA ATAAAGTTGT 60 

tCCTGGGCTT GGTACTGTTA TCTCaATATT GmwTGCaTTT GGTGGTCTAG CTTTTAATAT 120 

20 TGGTAATATT GCTGGTGCCG GTTTAGGTTT AAATGCAATT TTTGGATTAG ATGTAAAATG 180 

GGGCGCAGCT ATTACTGCAA TCTTTGCAAT ATTAATCTTT GTAAGTAAAA GTGGCCAAAA 24 0 

AATTATGGAC GTTGTTTCAA TGATTCTTGG TATTGTGATG ATTTTAGTTG TGGCATATGT 300 

GATGTTTGTT TCTAATCCAC CTTATGGTGA TGCTTTTGTG CATACATTTG CGCCAGAACA 3 60 

TCCAATGAAA TTAGTCTTGC CCATCATTAC GTTAGTTGGT GGAAcTGTar GTGGTTATAT 420 

TACCTTTGCA GGTGCACATC GTATATTAGA CTCTGGCATT AAAGGTAAGC AATATTTACC 4 80 

ATTTGTAAAT CAATCAGCAA TTGCTGGTAT TTTAACTACA GGTATTATGA GAACGTTACT 54 0 

ATTCCTAGCG GTATTAGGAG TTGTTGTAAC AGGTGTGACA CTAAGTTCTG AAAATCCACC 6 00 

AGCGTCAGTT TTTGAACACG CAATTGGACC AATTGGAAAG AATATTTTTG GTATTGTGTT 660 

ATTTGCTGCA GCTATGTCAT CAGTAATTGG CTCAGCATAC ACAAGCGCAA CATTTTTAAA 720 

AACACTTCAT AAATCACTTA ACGAAAGAAG TAATTTAATT GTGATTGTGT TTATCGTTAT 780 

40 TTCAACAATG ATTTTCTTAT TTATTGGAAA ACCAATCAGC CTTTTAATTA TAGCAGGCGC 84 0 
GATAAA 

(2) INFORMATION FOR SEQ ID NO: 23 0: 
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TCTTTTTAAA 


AGGTACTAAT 


ATTTCTTTAG 


TGAAAATTGA 


ATCACGGTCG 


TTTATTGGTG 


120 




CCTTGAGTAT 


ATTATTATAG 


ACGGAATCTG 


ATCTAATAAT 


ATTGATTTTA 


TACATGATAA 


180 


5 


ACCTCCTTAT 


GTTGTCAGCA 


TAAAGGATAA 


CGTAACGTGA 


TTTTCAAGCA 


GTAATTGTAA 


240 




CTAATTGAmA 


AAAATTAAGA 


AAAGTATGTG 


AGTGTTCCTA 


AwTAATATGa 


TTAAAATGAT 


300 


10 


GGCGAATAAG 


TGTCTaAAAG 


CATCTTAAAG 


GGACATTGTA 


TAGGGTAAAT 


CACTTCATAA 


360 


ATAAGGGaAA 


ATCCTTATGT 


TCACTTTTTC 


ACAATCATnA 


TAAAATATAT 


ATGTAGTCAA 


420 




TACTTTGTCT 


ATATTGAATG 


TTTTCATATA 


AATGAAAGCA 


TTTTTAAATA 


ACATTGACCT 


480 


IS 


CTAATATATA 


GGCAGAGTAT 


TGATATCTAT 


TAAAAAATAA 


ATGATTTTGA 


TGAAGGTGAA 


540 




ACGTATGTAC 


AAAACAAAAG 


GTGGCTTTCA 


ACTTACATTA 


CAAACATTAA 


GTTTAGTGGT 


600 




TGGGTTTATG 


GCTTGGAGTA 


TAATTGCGCC 


ATTAATGCCC 


TTTATTAAAC 


AAGATGTCAA 


660 


20 


TGTTACl'GAA 


GGTCAAATAT 


CAATCATTTT 


AGCGATACCA 


GTTATTTTGG 


GATCGGTCCT 


720 




CCGTGTGCCA 


TTTGGTTATT 


TAACAAACAT 


TGTTGGCGCT 


AAATGGGTAT 


TCTTTACTAG 


780 




TTTTATCGTA 


TTGTTATTCC 


CGATATTTTT 


CTTAAGCCAA 


GCACAAACAC 


CGGGTATGTT 


840 


25 


AATGGCTTCA 


GGATTTTTCC 


TTGGTGTAGG 


TGGTGCAATT 


TTCTCAGTTG 


GTGTTACATC 


900 




AGTTCCTAAA 


TATTTCCCTA 


AAGAAAAAGT 


AGGTCTAGCA 


AATGGTATTT 


ATGGTATGGG 


960 


30 


AAATATCGGT 


ACAGCAGTTT 


CTTCATTTTT 


AGCACCACCG 


ATAGCGGGTA 


TTATTGGTTG 


1020 


GCAAACAACA 


GTTAGAAGTT 


ACTTAATTAT 


TATCGCTTTA 


TTTGCATTAA 


TTATGTTCAT 


1080 




TTTTGGTGAC 


ACACAAGAAC 


GTAAAATTAA 


AGTACCATTA 


ATGGCtCAAA 


TGAAAmCATT 


1140 


3S 


ATCTAAAAAC 


TACAAATTAT 


ATTACTTAAG 


TTATTGGTAT 


TTTATTACTT 


TTGGTGCTTT 


1200 




TGTAGCATTT 


GGTATTTTCT 


TACCTAACTA 


CTTAGTAAAT 


CATTTTGGAA 


TTGACAAAGT 


1260 




AGATSCTGGT 


ATTCGATCAG 


GTGTATTCAT 


TGCGCTGGCA 


ACATTCTTAA 


GACCAATAGG 


1320 


40 


TGGCATTTTA 


GGTGATAAAT 


TTAATGCAGT 


TAAAGTATTG 


ATGATTGATT 


TTGTTGTTAT 


13 80 




GATTATCGGT 


GCCATTATTT 


TAGGTATTTC 


AGACCATATC 


GCATTATTCA 


CTGTAGGCTG 


1440 




TTTAACAATA 


AGTATTTGTG 


CAGGTATTGG 


TAACGGCTTA 


ATCTTCAAAT 


TAGTACCATC 


1500 


4S 


ATACTTCTTA 


AATGAAGCGG 


GATCCGCAAA 


TGGTATCGTA 


TCAATGATGG 


GTGGTTTAGG 


1560 




AGGATTCTTC 


CCACCACTAG 


TAATCACGTA 


CGTAGCTAAT 


TTAACAGGAT 


CAAGTCATTT 


.1620 


SO 


AGCATTTATT 


TTCTTAGCGG 


TATTnGGAnG 


TATTGCATTA 


TTTACCATGC 


GTCATTTATA 


1680 


CCAAAAAGAA 


TATGGCTCAT 


TGAAaAACGG 


TTGATATGTA 


ATACATG CCA 


TTcATTTAGT 


1740 




TAAATACAAA 


GCCTTaATAT 


CATGCGCAAT 


ATTCGTAGCA 


TGACATTAAG 


GCTTTAGTAG 


1800 
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